Einführung

Künstliche Intelligenz hat zahlreiche Bereiche revolutioniert, und die Codegenerierung ist keine Ausnahme. In Software program-Entwicklungnutzen Groups KI-Modelle, um Programmieraufgaben zu automatisieren und zu verbessern und so den Zeit- und Arbeitsaufwand der Entwickler zu reduzieren. Sie trainieren diese KI-Modelle anhand riesiger Datensätze, die viele Programmiersprachen umfassen, sodass die Modelle in unterschiedlichen Programmierumgebungen helfen können. Eine der Hauptfunktionen von KI in der Codegenerierung besteht darin, Codeausschnitte vorherzusagen und zu vervollständigen und so den Entwicklungsprozess zu unterstützen. KI-Modelle wie Codestral von Mistral AI, CodeLlama und DeepSeek Coder sind speziell für solche Aufgaben konzipiert.

Diese KI-Modelle kann Code generieren, Assessments schreiben, Teilcodes vervollständigen und sogar die Mitte bestehender Codesegmente ausfüllen. Diese Fähigkeiten machen KI-Instruments für moderne Entwickler unverzichtbar, die bei ihrer Arbeit auf Effizienz und Genauigkeit Wert legen. Die Integration von KI in die Codierung beschleunigt die Entwicklung und minimiert Fehler, was zu robusteren Softwarelösungen führt. Dieser Artikel befasst sich mit der neuesten Entwicklung von Mistral AI, Codestral.

Die Bedeutung von Leistungskennzahlen

Leistungsmetriken spielen eine entscheidende Rolle bei der Bewertung der Wirksamkeit von KI-Modellen bei der Codegenerierung. Diese Metriken liefern quantifizierbare Maße für die Fähigkeit eines Modells, genauen und funktionalen Code zu generieren. Die wichtigsten Benchmarks zur Leistungsbewertung sind HumanEval, MBPP, CruxEval, RepoBench und Spider. Diese Benchmarks testen verschiedene Aspekte der Codegenerierung, einschließlich der Fähigkeit des Modells, mit verschiedenen Programmiersprachen umzugehen und umfangreiche Aufgaben auf Repository-Ebene auszuführen.

Beispielsweise unterstreicht die Leistung des Codestral 22B bei diesen Benchmarks seine Überlegenheit bei der Erzeugung Python Und SQL Code, unter anderem. Das umfangreiche Kontextfenster des Modells mit 32.000 Token ermöglicht es ihm, die Konkurrenz bei Aufgaben zu übertreffen, die ein weitreichendes Verständnis und eine umfassende Vervollständigung erfordern. Metriken wie HumanEval bewerten die Fähigkeit des Modells, korrekte Codelösungen für Probleme zu generieren, während RepoBench seine Leistung bei der Codevervollständigung auf Repository-Ebene bewertet.

Genaue Leistungsmesswerte sind für Entwickler bei der Auswahl des richtigen KI-Instruments von entscheidender Bedeutung. Sie geben Aufschluss darüber, wie intestine ein Modell unter verschiedenen Bedingungen und Aufgaben funktioniert, und stellen sicher, dass sich Entwickler bei der Generierung von Code auf diese Instruments verlassen können. Das Verstehen und Vergleichen dieser Messwerte ermöglicht es Entwicklern, fundierte Entscheidungen zu treffen, was zu effektiveren und effizienteren Codierungsabläufen führt.

Mistral AI: Codestral 22B

Mistral AI entwickelte Codestral 22B, einen fortschrittlichen Open-Weight Generative KI Modell, das explizit für Codegenerierungsaufgaben entwickelt wurde. Das Unternehmen Mistral AI führte dieses Modell als Teil seiner Initiative ein, Entwickler zu befähigen und das Programmieren zu demokratisieren. Das Unternehmen erstellte sein erstes Codemodell, um Entwicklern dabei zu helfen, Code effizient zu schreiben und mit ihm zu interagieren, und zwar über einen gemeinsamen API-Endpunkt für Anweisungen und Vervollständigung. Die Notwendigkeit, ein Software bereitzustellen, das nicht nur die Codegenerierung beherrscht, sondern auch hervorragende Englischkenntnisse besitzt, trieb die Entwicklung von Codestral voran, wodurch es sich für die Entwicklung fortgeschrittener KI-Anwendungen für Softwareentwickler eignet.

Lesen Sie auch: Mixtral 8x22B von Mistral AI übertrifft Benchmarks in mehr als 4 Sprachen

Wichtige Funktionen und Fähigkeiten

Codestral 22B bietet mehrere wichtige Funktionen, die es von anderen Codegenerierungsmodellen abheben. Diese Funktionen stellen sicher, dass Entwickler die Funktionen des Modells in verschiedenen Codierungsumgebungen und Projekten nutzen können, was ihre Produktivität deutlich steigert und Fehler reduziert.

Kontextfenster

Eines der herausragenden Merkmale von Codestral 22B ist sein umfangreiches Kontextfenster mit 32.000 Token, das im Vergleich zu seinen Konkurrenten wie CodeLlama 70B, DeepSeek Coder 33B und Llama 3 70B, die Kontextfenster mit 4.000, 16.000 bzw. 8.000 Token bieten, deutlich größer ist. Dieses große Kontextfenster ermöglicht es Codestral, Kohärenz und Kontext über längere Codesequenzen hinweg aufrechtzuerhalten, was es besonders nützlich für Aufgaben macht, die ein umfassendes Verständnis großer Codebasen erfordern. Diese Fähigkeit ist für die Codevervollständigung auf Repository-Ebene über lange Distanzen von entscheidender Bedeutung, wie die überlegene Leistung im RepoBench-Benchmark zeigt.

Sprachkompetenz

Codestral 22B wird anhand eines vielfältigen Datensatzes trainiert, der über 80 Programmiersprachen umfasst. Diese breite Sprachbasis umfasst beliebte Sprachen wie Python, Java, C, C++, JavaScript und Bash sowie spezifischere Sprachen wie Swift und Fortran. Dank dieser umfassenden Schulung kann Codestral Entwickler in verschiedenen Codierungsumgebungen unterstützen und ist somit ein vielseitiges Software für verschiedene Projekte. Seine Kompetenz in mehreren Sprachen stellt sicher, dass es unabhängig von der verwendeten Sprache qualitativ hochwertigen Code generieren kann.

Fill-in-the-Center-Mechanismus

Ein weiteres bemerkenswertes Merkmal von Codestral 22B ist sein Fill-in-the-Center-Mechanismus (FIM). Dieser Mechanismus ermöglicht es dem Modell, partielle Codesegmente präzise zu vervollständigen, indem die fehlenden Teile generiert werden. Es kann Codierfunktionen vervollständigen, Assessments schreiben und alle Lücken im Code füllen, wodurch Entwickler viel Zeit und Mühe sparen. Diese Funktion verbessert die Codierungseffizienz und trägt dazu bei, das Risiko von Fehlern und Bugs zu verringern, wodurch der Codierungsprozess nahtloser und zuverlässiger wird.

Leistungshöhepunkte

Codestral 22B setzt einen neuen Normal in Bezug auf Leistung und Latenz von Codegenerierungsmodellen. Es übertrifft andere Modelle in verschiedenen Benchmarks und demonstriert damit seine Fähigkeit, komplexe Codierungsaufgaben effizient zu bewältigen. Im HumanEval-Benchmark für Python erreichte Codestral eine beeindruckende Erfolgsquote und demonstrierte damit seine Fähigkeit, funktionalen und genauen Code zu generieren. Es schnitt auch beim MBPP-Bereinigungsdurchgang und der CruxEval-Ausgabevorhersage für Python hervorragend ab und festigte damit seinen Standing als leistungsstärkstes Modell weiter.

Zusätzlich zu seinen Python-Fähigkeiten wurde die Leistung von Codestral in SQL mithilfe des Spider-Benchmarks bewertet, der ebenfalls starke Ergebnisse lieferte. Darüber hinaus wurde es in mehreren HumanEval-Benchmarks in Sprachen wie C++, Bash, Java, PHP, TypeScript und C# getestet und lieferte durchweg hohe Punktzahlen. Seine Fill-in-the-Center-Leistung battle in Python, JavaScript und Java besonders bemerkenswert und übertraf Modelle wie DeepSeek Coder 33B.

Diese Leistungshighlights unterstreichen die Fähigkeit von Codestral 22B, qualitativ hochwertigen Code in verschiedenen Sprachen und Benchmarks zu generieren und machen es zu einem unverzichtbaren Werkzeug für Entwickler, die ihre Codierproduktivität und -genauigkeit verbessern möchten.

Vergleichende Analyse

Benchmarks sind wichtige Messgrößen zur Bewertung der Modellleistung bei der KI-gesteuerten Codegenerierung. Codestral 22B, CodeLlama 70B, DeepSeek Coder 33B und Llama 3 70B wurden anhand verschiedener Benchmarks bewertet, um ihre Wirksamkeit bei der Generierung präzisen und effizienten Codes zu ermitteln. Zu diesen Benchmarks gehören HumanEval, MBPP, CruxEval-O, RepoBench und Spider for SQL. Darüber hinaus testeten sie die Modelle auf HumanEval in mehreren Programmiersprachen wie C++, Bash, Java, PHP, Typescript und C#, um einen umfassenden Leistungsüberblick zu bieten.

Leistung in Python

Python bleibt eine der wichtigsten Sprachen für die Programmierung und KI-Entwicklung. Die Bewertung der Leistung von Codegenerierungsmodellen in Python bietet eine klare Perspektive auf deren Nutzen und Effizienz.

Menschliche Eval

HumanEval ist ein Benchmark, der die Codegenerierungsfähigkeiten von KI-Modellen testet, indem ihre Fähigkeit bewertet wird, von Menschen geschriebene Programmierprobleme zu lösen. Codestral 22B zeigte eine beeindruckende Leistung mit einer Erfolgsquote von 81,1 % bei HumanEval und stellte damit seine Kompetenz bei der Generierung präzisen Python-Codes unter Beweis. Im Vergleich dazu erreichte CodeLlama 70B eine Erfolgsquote von 67,1 %, DeepSeek Coder 33B erreichte 77,4 % und Llama 3 70B erreichte 76,2 %. Dies zeigt, dass Codestral 22B bei der Bewältigung von Python-Programmieraufgaben effektiver ist als seine Gegenstücke.

MBPP

Der MBPP-Benchmark (A number of Benchmarks for Programming Issues) bewertet die Fähigkeit des Modells, vielfältige und bereinigte Programmierprobleme zu lösen. Codestral 22B erreichte im MBPP eine Erfolgsquote von 78,2 % und lag damit knapp hinter DeepSeek Coder 33B, der 80,2 % erreichte. CodeLlama 70B und Llama 3 70B zeigten mit 70,8 % bzw. 76,7 % konkurrenzfähige Ergebnisse. Die starke Leistung von Codestral im MBPP spiegelt sein robustes Coaching anhand vielfältiger Datensätze wider.

CruxEval-O

CruxEval-O ist ein Benchmark zur Bewertung der Fähigkeit des Modells, Python-Ausgaben genau vorherzusagen. Codestral 22B erreichte eine Erfolgsquote von 51,3 %, was auf eine solide Leistung bei der Ausgabevorhersage hinweist. CodeLlama 70B erreichte 47,3 %, während DeepSeek Coder 33B und Llama 3 70B 49,5 % bzw. 26,0 % erreichten. Dies zeigt, dass Codestral 22B im Vergleich zu anderen Modellen bei der Vorhersage von Python-Ausgaben hervorragend abschneidet.

RepoBench

RepoBench bewertet die Codevervollständigung auf Repository-Ebene über lange Distanzen. Codestral 22B mit seinem 32k-Kontextfenster übertraf andere Modelle mit einer Vervollständigungsrate von 34,0 % deutlich. CodeLlama 70B, DeepSeek Coder 33B und Llama 3 70B erzielten 11,4 %, 28,4 % bzw. 18,4 %. Das größere Kontextfenster von Codestral 22B verschafft ihm einen deutlichen Vorteil bei der Vervollständigung von Codegenerierungsaufgaben über lange Distanzen.

Vergleichende Analyse von Codestral 22B von Mistral AI mit anderen KI-Modellen

SQL-Benchmark: Spider

Der Spider-Benchmark testet die SQL-Generierungsfähigkeiten. Codestral 22B erreichte in Spider eine Erfolgsquote von 63,5 % und übertraf damit seine Konkurrenten. CodeLlama 70B erreichte 37,0 %, DeepSeek Coder 33B 60,0 % und Llama 3 70B 67,1 %. Dies zeigt, dass Codestral 22B in der SQL-Codegenerierung kompetent ist, was es zu einem vielseitigen Software für die Datenbankverwaltung und Abfragegenerierung macht.

Durch die Analyse dieser Benchmarks wird deutlich, dass Codestral 22B in Python herausragend ist und in verschiedenen Programmiersprachen konkurrenzfähig abschneidet, was es zu einem vielseitigen und leistungsstarken Software für Entwickler macht.

Vergleichende Analyse von Codestral 22B von Mistral AI mit anderen KI-Modellen

Wie greife ich auf Codestral zu?

Sie können diese einfachen Schritte befolgen und Codestral verwenden.

Chat-Fenster verwenden

  1. Ein Konto erstellen

    Rufen Sie diesen Hyperlink auf und https://chat.mistral.ai/chat Und Erstelle deinen Account.

  2. Wählen Sie das Modell

    Sie werden mit einem chatähnlichen Fenster auf Ihrem Bildschirm begrüßt. Wenn Sie genau hinsehen, finden Sie direkt unter dem Eingabefeld ein Dropdown-Menü, in dem Sie das Modell auswählen können, mit dem Sie arbeiten möchten. Hier wählen wir Codestral aus.

  3. Geben Sie die Eingabeaufforderung

    Schritt 3: Nachdem Sie Codestral ausgewählt haben, können Sie Ihre Eingabeaufforderung eingeben.

Verwenden der Codestral-API

Codestral 22B bietet einen gemeinsamen API-Endpunkt für Anweisungen und Vervollständigung, der es Entwicklern ermöglicht, programmgesteuert mit dem Modell zu interagieren. Mit dieser API können Entwickler die Funktionen des Modells in ihren Anwendungen und Arbeitsabläufen nutzen.

Verwenden der Codestral-API | Codegenerierung

In diesem Abschnitt demonstrieren wir die Verwendung der Codestral-API zum Generieren von Code für ein lineares Regressionsmodell in scikit-learn und zum Vervollständigen eines Satzes mithilfe des Füllmechanismus in der Mitte.

Zuerst müssen Sie den API-Schlüssel generieren. Erstellen Sie dazu ein Konto unter https://console.mistral.ai/codestral und generieren Sie Ihren API-Schlüssel im Codestral Abschnitt.

Verwenden der Codestral-API | Codegenerierung

Da die Einführung langsam erfolgt, können Sie es möglicherweise nicht sofort verwenden.

Code-Implementierung

import requests

import json

# Substitute together with your precise API key

API_KEY = userdata.get('Codestral_token')

# The endpoint you need to hit

url = "https://codestral.mistral.ai/v1/chat/completions"

# The info you need to ship

knowledge = {

   "mannequin": "codestral-latest",

   "messages": (

       {"position": "person", "content material": "Write code for linear regression mannequin in scikit study with scaling, you'll be able to choose  diabetes datasets from the sklearn library."}

   )

}

# The headers for the request

headers = {

   "Authorization": f"Bearer {API_KEY}",

   "Content material-Sort": "software/json"

}

# Make the POST request

response = requests.publish(url, knowledge=json.dumps(knowledge), headers=headers)

# Print the response

print(response.json()('decisions')(0)('message')('content material'))

Ausgabe:

Verwenden der Codestral-API | Codegenerierung

Abschlussendpunkt

import requests
import json

# Substitute together with your precise API key
API_KEY = userdata.get('Codestral_token')

# The endpoint you need to hit
url = "https://codestral.mistral.ai/v1/fim/completions"

# The info you need to ship
knowledge = {
    "mannequin": "codestral-latest",
    "immediate": "The India is a"

}

# The headers for the request
headers = {
    "Authorization": f"Bearer {API_KEY}",
    "Content material-Sort": "software/json"
}

# Make the POST request
response = requests.publish(url, knowledge=json.dumps(knowledge), headers=headers)

# Print the response
print(response.json()('decisions')(0)('message')('content material'))

Ausgabe:

Indien ist ein Land mit einer reichen und vielfältigen Kultur, und seine Musik spiegelt dies wider. Von den klassischen Melodien der Hindustani-Musik bis zu den lebhaften Beats von Bollywood hat die indische Musik für jeden etwas zu bieten.

Hindustani music is the classical music of North India, which has its roots within the historic Sanskrit language. It's characterised by its use of advanced rhythmic patterns, intricate melodies, and elaborate ornamentation. Hindustani music is commonly carried out by educated musicians utilizing conventional devices such because the sitar, tabla, and sarangi.

Bollywood music, then again, is the favored music of the Indian movie trade. It's a fusion of assorted musical kinds, together with Hindustani, Western, and regional Indian music. Bollywood songs are sometimes characterised by their catchy melodies, upbeat rhythms, and full of life dance numbers. They're typically sung by in style playback singers and have a wide range of devices, together with the harmonium, electrical guitar, and drums.

Regional Indian music refers back to the music of the varied states and areas of India. Every area has its personal distinctive musical traditions, devices, and kinds. For instance, Carnatic music is the classical music of South India, which relies on the traditional Sanskrit language and is characterised by its use of advanced rhythmic patterns and complex melodies. Different regional Indian music kinds embrace people music, devotional music, and music from the varied Indian languages.

Indian music can also be influenced by numerous non secular and cultural traditions. For instance, Sufi music, which originated in Persia, has been tailored and integrated into Indian music, leading to a novel mix of Jap and Western musical kinds. Devotional music, comparable to Bhajans and Kirtans, is commonly utilized in non secular ceremonies and is characterised by its easy melodies and repetitive chanting.

Indian music just isn't solely in style inside India, but it surely has additionally gained worldwide recognition. Many Indian musicians have achieved success within the world music trade, and Indian music has been integrated into numerous genres of Western music, comparable to jazz, rock, and pop.

In conclusion, Indian music is a wealthy and numerous artwork type that displays the nation's cultural heritage. From Hindustani music to Bollywood, regional Indian music to devotional music, Indian music has one thing for everybody. Its affect might be seen not solely inside India but in addition within the world music trade.

Ich habe eine Colab-Notizbuch zur Verwendung der API zum Generieren von Antworten aus Codestral, auf die Sie verweisen können. Mithilfe der API habe ich einen voll funktionsfähigen Regressionsmodellcode generiert, den Sie direkt ausführen können, nachdem Sie einige kleine Änderungen an der Ausgabe vorgenommen haben.

Abschluss

Codestral 22B von Mistral AI ist ein zentrales Software für die KI-gesteuerte Codegenerierung und zeigt außergewöhnliche Leistung in mehreren Benchmarks wie HumanEval, MBPP, CruxEval-O, RepoBench und Spider. Sein großes Kontextfenster mit 32.000 Token und seine Kompetenz in über 80 Programmiersprachen, darunter Python, Java, C++ und mehr, heben es von der Konkurrenz ab. Der fortschrittliche Fill-in-the-Center-Mechanismus des Modells und die nahtlose Integration in beliebte Entwicklungsumgebungen wie VSCode, JetBrains, LlamaIndex und LangChain verbessern seine Benutzerfreundlichkeit und Effizienz.

Positives Suggestions aus der Entwickler-Group unterstreicht die Auswirkungen auf die Produktivitätssteigerung, die Fehlerreduzierung und die Optimierung von Codierungsabläufen. Während sich die KI weiterentwickelt, machen die umfassenden Funktionen und die robuste Leistung von Codestral 22B es zu einem unverzichtbaren Hilfsmittel für Entwickler, die ihre Codierungspraktiken optimieren und komplexe Herausforderungen bei der Softwareentwicklung bewältigen möchten.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert