Mistral AI hat Devstral 2 eingeführt, eine Codierungsmodellfamilie der nächsten Technology für Software program-Engineering-Agenten, zusammen mit Mistral Vibe CLI, einem Open-Supply-Befehlszeilen-Codierungsassistenten, der im Terminal oder in IDEs ausgeführt wird, die das Agent Communication Protocol unterstützen.

https://mistral.ai/information/devstral-2-vibe-cli

Devstral 2 und Devstral Small 2, Modellgrößen, Kontext und Benchmarks

Devstral 2 ist ein 123B Parameter-dichter Transformator mit einem 256K Token-Kontextfenster. Im SWE-Bench Verified erreicht es 72,2 Prozent und zählt damit zu den stärksten Open-Weight-Modellen für Software program-Engineering-Aufgaben. Das Modell wird als offene Gewichte unter einer modifizierten MIT-Lizenz veröffentlicht und kann derzeit kostenlos über die Mistral-API verwendet werden.

Devstral Small 2 ist ein 24B-Parametermodell mit demselben 256K-Kontextfenster. Im SWE-Bench-Verified erreicht es 68,0 Prozent und liegt in der Reihe der Modelle, deren Parameteranzahl bis zu fünfmal größer ist. Es wird unter der Apache 2.0-Lizenz veröffentlicht, einer Standardlizenz für den produktiven Einsatz.

Beide Modelle werden als Open Supply beschrieben und freizügig lizenziert und gelten als hochmoderne Codierungsmodelle für Agenten-Workloads. Mistral berichtet, dass Devstral 2 bei realen Codierungsaufgaben bei ähnlicher Qualität bis zu siebenmal kosteneffizienter ist als Claude Sonnet, was für kontinuierliche Agentenauslastungen wichtig ist.

https://mistral.ai/information/devstral-2-vibe-cli

In Bezug auf die Modellgröße im Vergleich zu Grenzsystemen sind Devstral 2 und Devstral Small 2 5-mal bzw. 28-mal kleiner als DeepSeek V3.2 und 8-mal bzw. 41-mal kleiner als Kimi K2.

Entwickelt für Codierungsworkflows in Produktionsqualität

Devstral 2 wurde für Software program-Engineering-Agenten entwickelt, die Repositorys erkunden, Abhängigkeiten verfolgen und Änderungen an vielen Dateien orchestrieren müssen, während sie gleichzeitig den Kontext auf Architekturebene beibehalten müssen. Das Modell kann Fehler erkennen, es mit Korrekturen erneut versuchen und Aufgaben wie Fehlerbehebung oder Modernisierung von Altsystemen auf Repository-Ebene unterstützen.

Mistral gibt an, dass Devstral 2 fein abgestimmt werden kann, um bestimmte Programmiersprachen zu bevorzugen oder für sehr große Unternehmenscodebasen zu optimieren. Devstral Small 2 bringt die gleichen Designziele auf eine kleinere Stellfläche, die für die lokale Bereitstellung, enge Feedbackschleifen und vollständig non-public Laufzeiten geeignet ist. Es unterstützt auch Bildeingaben und kann multimodale Agenten steuern, die sowohl über Code als auch über visuelle Artefakte wie Diagramme oder Screenshots nachdenken müssen.

https://mistral.ai/information/devstral-2-vibe-cli

Menschliche Bewertungen gegen DeepSeek V3.2 und Claude Sonnet 4.5

Um das Codierungsverhalten in der Praxis zu testen, evaluierte Mistral Devstral 2 im Vergleich zu DeepSeek V3.2 und Claude Sonnet 4.5 mithilfe von Aufgaben, die über das Cline-Agententool erstellt wurden. In diesen menschlichen Bewertungen zeigt Devstral 2 einen klaren Vorteil gegenüber DeepSeek V3.2 mit einer Gewinnrate von 42,8 Prozent gegenüber einer Verlustrate von 28,6 Prozent.

Mistral Vibe CLI, ein terminal-nativer Codierungsagent

Mistral Vibe CLI ist ein Open-Supply-Befehlszeilen-Codierungsassistent, der in Python geschrieben ist und auf Devstral-Modellen basiert. Es untersucht, modifiziert und führt Änderungen in einer Codebasis mithilfe natürlicher Sprache im Terminal oder in IDEs aus, die das Agent Communication Protocol wie Zed unterstützen, wo es als Erweiterung verfügbar ist. Das Projekt wird unter veröffentlicht Apache 2.0-Lizenz auf GitHub.

Vibe CLI bietet zusätzlich zu mehreren wichtigen Instruments eine Schnittstelle im Chat-Stil:

  • Es scannt den projektbezogenen Kontext und scannt die Dateistruktur und den Git-Standing, um eine Arbeitsansicht des Repositorys zu erstellen.
  • Intelligente Referenzen werden unterstützt @ Autovervollständigung für Dateien, ! für Shell-Befehle und Slash-Befehle für Konfigurationsänderungen.
  • Bei der Orchestrierung mehrerer Dateien wird die gesamte Codebasis und nicht nur der aktive Puffer berücksichtigt, um Änderungen auf Architekturebene zu koordinieren und die Zykluszeit für Pull-Anfragen zu verkürzen.
  • Persistenter Verlauf, automatische Vervollständigung und für den täglichen Gebrauch im Terminal optimierte Themen.

Entwickler konfigurieren Vibe CLI auf einfache Weise config.toml Datei, in der sie über die Mistral-API auf Devstral 2 oder auf andere lokale oder Distant-Modelle verweisen können. Das Software unterstützt programmgesteuerte Ausführungen, automatische Genehmigungsumschaltungen für die Toolausführung und granulare Berechtigungen, sodass riskante Vorgänge in sensiblen Repositorys eine Bestätigung erfordern.

Wichtige Erkenntnisse

  1. Devstral 2 ist ein 123B Parameter dichtes Codierungsmodell mit 256K Kontext, es erreicht 72,2 Prozent bei SWE Bench Verified und wird als offene Gewichte unter einer modifizierten MIT-Lizenz veröffentlicht.
  2. Devstral Small 2 hat 24B Parameter mit dem gleichen 256K-Kontext, erreicht beim SWE-Bench-Verified 68,0 Prozent und nutzt eine Apache 2.0-Lizenz für eine einfachere Produktionseinführung.
  3. Beide Devstral-Modelle sind für Agenten-Codierungs-Workloads optimiert. Sie sind darauf ausgelegt, vollständige Repositorys zu erkunden, Abhängigkeiten zu verfolgen und mehrere Dateibearbeitungen mit Fehlererkennung und Wiederholungsversuchen durchzuführen.
  4. Mistral Vibe CLI ist ein Open-Supply-Python-basierter nativer Terminal-Coding-Agent, der eine Verbindung zu Devstral herstellt. Er bietet projektbezogenen Kontext, intelligente Referenzen und Orchestrierung mehrerer Dateien über eine Chat-Schnittstelle im Terminal oder IDEs, die das Agent Communication Protocol unterstützen.

Schauen Sie sich das an Ausführliche technische Particulars hier. Schauen Sie sich gerne bei uns um GitHub-Seite für Tutorials, Codes und Notebooks. Sie können uns auch gerne weiter folgen Twitter und vergessen Sie nicht, bei uns mitzumachen 100.000+ ML SubReddit und Abonnieren Unser E-newsletter. Warten! Bist du im Telegram? Jetzt können Sie uns auch per Telegram kontaktieren.


Asif Razzaq ist CEO von Marktechpost Media Inc.. Als visionärer Unternehmer und Ingenieur setzt sich Asif dafür ein, das Potenzial der künstlichen Intelligenz für das soziale Wohl zu nutzen. Sein jüngstes Unterfangen ist die Einführung einer Medienplattform für künstliche Intelligenz, Marktechpost, die sich durch eine ausführliche Berichterstattung über maschinelles Lernen und Deep-Studying-Nachrichten auszeichnet, die sowohl technisch fundiert als auch für ein breites Publikum leicht verständlich ist. Die Plattform verfügt über mehr als 2 Millionen monatliche Aufrufe, was ihre Beliebtheit beim Publikum verdeutlicht.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert