Die chinesische KI-Firma Minimaxai hat gerade ein großes Open-Supply-Argumentationsmodell namens Minimax-M1 auf den Markt gebracht. Das Modell, das am ersten Tag des 5-tägigen MinimaxWeek-Occasions veröffentlicht wurde, scheint einen guten Wettbewerb für Openai O3, Claude 4, Deepseke-R1 und andere Zeitgenossen zu verleihen. Zusammen mit dem Chatbot hat Minimax auch einen Agenten in der Beta -Model veröffentlicht, in dem Code ausgeführt, Apps erstellt, Präsentationen erstellt werden können und vieles mehr. In diesem Artikel werden wir die wichtigsten Funktionen von Minimax-M1 untersuchen, lernen, wie man darauf zugreift, und sie an einigen Aufgaben testen. Wir werden auch den Minimax -Agenten erkunden. Lesen Sie additionally bis zum Ende, um den Agenten in Aktion zu beobachten!

Was ist Minimax-M1?

Minimax -M1 ist ein offenes, großes, großes, hybrides Begründungsmodell, das von der in Shanghai basierenden KI -Startup -Minimax entwickelt wurde. Das Denkmodell verfügt über eine Websuchfunktion und kann multimodale Eingaben in Kind von Textual content, Bildern, Präsentationen und mehr über verschiedene Formate hinweg verarbeiten.

Auf a gebaut Mischungsarchitektur (Mischungsteuerung (MOE)Das Modell wird mit insgesamt 456 Milliarden Parametern geschult, wobei etwa 45,9 Milliarden professional Token aktiviert sind. Darüber hinaus wird das Modell unter einer Apache 2.0-Lizenz veröffentlicht, was es wirklich offen macht.

Minimax hat Blitzaufmerksamkeit für sein M1 -Modell eingeführt, wodurch die Inferenzkosten drastisch gesenkt werden. Um es in Zahlen auszudrücken, verwendet es nur 25% der Flops im Vergleich zu Deepseek -R1 bei 100.000 -beanstandete Era. Das Modell wird über RL mit großem Skala unter Verwendung von CISPO (abgeschnittene Abtastungspolitikoptimierung) trainiert, die abtastete Gewichte anstelle von Aktualisierungen. Dies führte zu einer effizienten Schulung am 512 A800 -GPUs über 3 Wochen und kostete nur rund 534.700 US -Greenback. Dies ist weitaus niedriger als die Millionen von Wettbewerbern wie OpenAI und Google.

Schlüsselmerkmale

Hier sind die Hauptmerkmale des neuen Minimax-M1-Modells:

  1. Hybride Aufmerksamkeit + MOE -Effizienz: M1 kombiniert eine MOE -Architektur mit blitzschneller Aufmerksamkeit und erzielt im Vergleich zu den meisten anderen Modellen bis zu 75% Recheneinsparungen.
  2. Großes Anhaltungsfenster: Das größte Spotlight von M1 ist das huge Kontextfenster von 1M Eingangs -Token -Token und bis zu 80.000 Ausgangs -Token, was mit Googles Gemini 2.5 Professional mitgeht.
  3. Erhältlich in 40K & 80.000 Denkbudgets: Minimax bietet M1-40K (mittlere) und M1-80K (Superior) -Versionen an. Die 80K -Variante ist bei erweiterten Argumentation und komplexen Aufgaben besser abgestimmt.
  4. Erweiterte agenten- und langkundigende Argumentation: Die Fashions-Benchmark-Leistungen zeigen, dass sie sich bei Lengthy-kontext-Benchmarks (OpenAI-MRCR, Longbench-V2) und dem agentischen Werkzeuggebrauch (TAU-BENCH) auszeichnet.

Lesen Sie auch: Das neue Replace von Deepseek R1-0528 ist verrückt

Minimax -M1: Benchmark -Leistung

So stapelt sich das M1-80K -Modell in den wichtigsten Benchmark -Domänen:

Minimax -M1 -Benchmark -Leistung
  • Aime 2024: Minimax-M1 erzielte den höchsten Rating (86,0%) und übertraf alle proprietären Modelle wie OpenAI O3, Claude 4 Opus und Gemini 2.5 Professional.
  • LivecodeBench: Minimax-M1 erzielte in diesem Codierungsbenchmark 65,0%, nur leicht hinter OpenAI O3 und Gemini.
  • SWE-Bench verifiziert: In diesem Software program-Engineering-Benchmark erreichte Minimax-M1 56,0percentund übertraf die Deepseek-R1 und QWEN3 um über 10percenteindeutig.
  • Tau-Bench: Bei der Verwendung von Agentenwerkzeugen erzielte Minimax-M1 62,8percentund schlug sowohl Deepseek als auch QWEN3. Dies zeigt die starken Fähigkeit des Modells des Modells.
  • MRCR: Der MRCR-Benchmark testet die Fähigkeiten der Modelle in der Analyse von mehreren Runden und Langkunden. Minimax-M1 erzielte bei dem Check 73,4% und kam den besten kommerziellen Modellen und weit vor anderen Open-Supply-Modellen.

Lesen Sie auch: Was sind LLM -Benchmarks?

So greifen Sie auf Minimax -M1 zu

Minimax -M1 ist vollständig geöffnet und für beide verfügbar Github Und Umarmtes Gesicht. Sie können das Modell auch direkt auf der Chatbot -Schnittstelle verwenden: https://chat.minimax.io/.

Die Minimax-API bietet ebenfalls strukturierte funktionierende Schnittstellen und andere Chatbot-APIs. Es bietet auch Instruments für die Suche, Bild-/Videogenerierung, Sprachsynthese und Sprachklone – jetzt auf agierische Workflows zugeschnittene.

Minimax-M1: praktische Assessments

Nachdem wir wissen, wie wir auf Minimax-M1 zugreifen können, versuchen wir es aus. In diesem Abschnitt teste ich drei verschiedene Eingabeaufforderungen, um die Leistung des Modells in zu messen:

  1. Codierung einer animierten Simulation
  2. Durchsuchen des Webs in Echtzeit
  3. Lösen eines logischen Argumentationsrätsels

Fangen wir an!

Aufgabe 1: Animierte Simulation

Immediate: „Erzeugen Sie eine Simulation eines roten Pentagons, das sich im Uhrzeigersinn in einem schwarzen Sechseck dreht. Im Pentagon bewegen sich im Pentagon – ein Blau, ein Gelb – ab den Wänden, die den Gesetzen der Physik folgen. Jedes Mal, wenn ein Ball eine Kante trifft, müssen sich seine Farbe ändern. Und jedes Mal, wenn sie miteinander kollidieren, müssen sie beide die Mischung beider Farben beider Farben.“ „

Ausgabe

Rezension

In etwa 10 Minuten erzeugte Minimax-M1 einen sauberen und effizienten Code mit geeigneten Erklärungen, um die Simulation zu erstellen. Es wurde optisch klar und physisch genau, genau der Eingabeaufforderung. Die Bälle bleiben jedoch manchmal an den Rändern, die ich als Fehler feststellte. Außerdem werden die Bälle schließlich aus der Simulation geworfen, die ich nicht erwartet hatte. Aber im Großen und Ganzen hat mir das Ergebnis gefallen.

Lassen Sie uns nun sehen, wie intestine das Modell das Net in Echtzeit durchsuchen kann. In dieser Aufgabe werde ich Minimax M1 bitten, mir Occasions in dieser Woche in meiner Stadt zu finden. Ich werde den Suchmodus für diese Aufgabe einschalten.

Immediate: „Welche Stand-up-Comedy-Exhibits finden diese Woche in Gurgaon statt?“

Ausgabe

Minimax -M1 -Websuche

Rezension

Minimax M1 suchte quick sofort auf 30 verschiedenen Web sites, darunter Distrikte, alle Ereignisse und sogar Ereignislisten auf Fb und Instagram. Es sammelte alle Informationen und gab mir eine Liste aller Stand-up-Ereignisse. Die Suche wurde richtig durchgeführt, aber das Modell konnte das Timing und den Veranstaltungsort der Ereignisse nicht lesen oder erkennen. Es wurde jedoch alle Quellwebsites auf der rechten Seite aufgeführt, sodass es einfacher ist, auf die Buchungsseiten zuzugreifen.

Aufgabe 3: logisches Puzzle

Minimax M1 ist ein Argumentationsmodell mit Denkfunktionen. Additionally werde ich ihm ein logisches Puzzle geben, um diese Aufgabe zu lösen. Ich werde auch den „Suppose“ -Modus einschalten, damit der Denkprozess des Modells.

Immediate: „Vier Leute überqueren nachts eine Brücke, additionally brauchen sie alle eine Taschenlampe – aber sie haben nur eine, die nur 15 Minuten dauert. Alice kann in einer Minute in zwei Minuten, Cindy, in fünf Minuten und Don in acht Minuten überqueren. Nicht mehr als zwei Leute können gleichzeitig überqueren; und wenn zwei Kreuzungen das Tempo des Menschen langsamer werden.

Ausgabe

„Die optimale Lösung, um alle vier innerhalb von 15 Minuten zu vermitteln, lautet wie folgt:

  1. Alice und Ben kreuzen zusammen (2 Minuten).
    Die Zeit verstrichen: 2 Minuten
    Menschen auf der anderen Seite: Alice, Ben
  2. Alice kehrt alleine zurück (1 Minute).
    Die Zeit verstrichen: 3 Minuten
    Leute auf der Anfangseite: Alice, Cindy, Don
  3. Cindy und Don kreuzen zusammen (8 Minuten).
    Die Zeit verstrichen: 11 Minuten
    Menschen auf der anderen Seite: Cindy, Don, Ben
  4. Ben kehrt alleine zurück (2 Minuten).
    Die Zeit verstrichen: 13 Minuten
    Leute auf der Startseite: Alice, Ben
  5. Alice und Ben kreuzen sich wieder zusammen (2 Minuten).
    Die Zeit verstrichen: 15 Minuten
    Alle vier auf der anderen Seite: Alice, Ben, Cindy, Don

Schlüsselstrategie: Verwenden Sie die beiden schnellsten Personen (Alice und Ben), um die Taschenlampe effizient zu übernehmen und die zeitlich langsameren Personen (Cindy und Don) zusammen zu minimieren. Dadurch wird die Notwendigkeit ausgleichen, sich langsamere Personen zu bewegen und gleichzeitig die Fackelzeit zu erhalten. “

Rezension

Minimax-M1 dauerte ungefähr 2 Minuten (125,2 Sekunden), um über das Downside nachzudenken und die Lösung herauszufinden. Der logische Denkprozess des Modells stand im Punkt und führte zur richtigen Antwort. Es musste keine der Gedanken zurückverfolgen, aber an einigen Stellen dauerte es ein bisschen länger, um nachzudenken.

Minimax Agent in Aktion

Kommen wir nun zum coolsten Teil der neuen Begins von Minimax – dem Minimax -Agenten. Obwohl derzeit in der Beta -Section, sind seine Fähigkeiten und vielfältigen Anwendungsfälle in der Welt der AI -Agenten vielversprechend. Um seine Fähigkeiten zu testen, gab ich ihm die Aufforderung, mir eine interaktive Web site zu erstellen. So lief das.

Immediate: „Erstellen Sie eine interaktive Web site mit einer virtuellen Tour durch Indien.

  1. Es muss die Landkarte mit den markierten Staaten zeigen und den Benutzer den Namen des Staates und die jeweilige Hauptstadt lesen lassen, wenn er die Maus darüber schwebt.
  2. Es muss nach Klicken in den ausgewählten Zustand vergrößern und alle berühmten Denkmäler und Sehenswürdigkeiten als repräsentative Symbole zeigen.
  3. Auch hier müssen ihre Namen und der Standort (Title der Stadt) angezeigt werden, wenn sie über dem Image schwebten.
  4. Wenn Sie auf ein Image klicken, muss ein Seitenfeld auftauchen, das tatsächliche Bilder, den Ort, die Besuchszeiten und die Eintrittsgebühr des Wahrzeichens zeigt.
  5. Der Benutzer muss die Möglichkeit haben, mehrere Orientierungspunkte auszuwählen, und die App/Web site muss eine realistische Reiseroute für den Besuch all dieser Orte erstellen, in der auch festgelegt wird, wie viele Tage erforderlich sind, um sie alle abzudecken. Dies muss auch die Pendelzeit berücksichtigt, die auf Google Maps basiert. “

Ausgabe

Und hier ist die Web site, die sie für mich erstellt hat:

Rezension

Minimax Agent hat großartige Arbeit geleistet, um eine interaktive Web site zu erstellen, um meine Anforderungen zu erfüllen. Obwohl die endgültige Web site nicht genau so conflict, wie ich in meiner Aufforderung erklärt hatte, muss ich sagen, dass die Ergebnisse beeindruckend sind. Der Agent fand die Informationen, fügte den Textual content und die Bilder hinzu, erhielt API -Tasten, Zugriff auf Google Maps und andere Apps, erstellte das gesamte System und testete es sogar – alles von selbst. Es dauerte ungefähr 20 Minuten, um das Ganze zu erledigen, und lieferte sogar Dokumentation des Prozesses, die Testergebnisse und alle anderen Particulars. Ein kostenloses Instrument, der all das so intestine macht, ist nur umwerfend!

Hier können Sie die vollständige Web site erleben: https://03w1ujb85t.house.minimax.io/

Sie können den Agenten auch kostenlos durch ausprobieren Klicken Sie hier. Sobald Sie sich mit Ihrer E -Mail -ID angemeldet haben, gibt Ihnen Minimax 1.000 kostenlose Credit für die Ausführung des Agenten.

Abschluss

Minimax-M1 ist ein großer Sprung in der Open-Supply-KI. Es ist ein einzigartiges MOE-Modell für Hybridandachtung, das Skalierung und Berechnungseffizienz kombiniert. Mit einem erstaunlichen 1-m-Token-Kontextfenster kann dieses neue Modell Langformpunkte und Dokumentenverständnisse haben. Trotz der niedrigen Trainingskosten zeigt es wettbewerbsfähige oder überlegene Leistung in Standardbenchmarks.

Der Minimax -Agent ist auch sehr beeindruckend und kann selbst Präsentationen, Web sites und Apps erstellen. Die Chatbot -Schnittstelle und Reside -Updates auf der Seite verleihen den Benutzern das Gefühl der Vibe -Codierung. Insgesamt legt Minimax-M1 einen neuen Customary in der Open-Supply-Modellentwicklung fest. Wenn es technische Raffinesse, wirtschaftliche Effizienz und Zugänglichkeit verbindet, hat es eine leistungsstarke Grundlage für KI-Chatbots und Agenten der nächsten Era aufgebaut. Da es kostenlos für alle verwendet wird, probieren Sie es aus und teilen Sie uns in den Kommentaren mit, wie Sie es finden.

Sabreena ist Genai -Enthusiastin und Tech -Redakteurin, die sich leidenschaftlich darum kümmern, die neuesten Fortschritte zu dokumentieren, die die Welt prägen. Derzeit erkundet sie die Welt der KI und Knowledge Science als Managerin für Inhalt und Wachstum bei Analytics Vidhya.

Melden Sie sich an, um weiter zu lesen und Experten-Kuratinhalte zu genießen.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert