Codierungsassistenten werden nach der Veröffentlichung von populär Claude -Code Und OpenAI Codex Cli. Was folgte, conflict eine Flut neuer Werkzeuge aus Gemini Cli zu grok 4 codex. Jetzt tritt Qwen 3 in den Kampf ein und möchte als mächtige Open-Supply-Various auferstehen. Egal, ob Sie vor einem schwierigen Codierungsproblem konfrontiert sind oder einfach nur nach einer intelligenteren Artwork und Weise suchen, QWEN 3 bietet eine kostenlose, progressive Lösung. Entwickelt für fortschrittliche Codegenerierung und versatile Codierungs -Workflows, ist perfekt für Datenwissenschaftler und KI -Enthusiasten. In diesem Weblog werden wir untersuchen, was Qwen 3 auszeichnet.

Was ist Qwen3-Codierer?

QWEN3-CODER ist das neueste und leistungsstärkste Open-Supply-KI-Modell des QWEN-Groups. Das Flaggschiff-Modell in dieser Serie ist der QWEN3-CODER-480B-A35B-Instruct, der eine huge Parameterarchitektur von 480 Milliarden Parametern bietet.

Ein wichtiges Merkmal dieses Modells ist die Verwendung einer Moe-of-Experten-Architektur (Expertenmischung). Mit diesem Design kann das Modell effizienter sein, indem nur ein kleiner Teil seiner Parameter zu einem bestimmten Zeitpunkt aktiviert wird.

Wichtige Highlights von QWEN3-CODER

  • 480 Milliarden Parameter: Das Modell wird von 480 Milliarden Parametern angetrieben, aber nur mit 35 Milliarden sind während einer Abfrage aktiv.
  • Effizienz durch Moe: Mit dem Ansatz der Expertenmischung werden nur eine ausgewählte Anzahl von Experten (die mit dem relevanten Thema vertraut sind) für eine bestimmte Aufgabe aktiviert, wodurch sie leistungsfähig und dennoch überschaubar ist.
  • Langes Kontextfenster: Es unterstützt einen Kontext von 256.000 Tokenwas erweitert werden kann auf 1 Million TokenVerwendung von Extrapolation.
  • Extrapolation: Diese Funktion ermöglicht das Modell, größere Eingaben zu verarbeiten, als es ursprünglich geschult wurde, was eine größere Flexibilität und Kapazität ermöglicht.

Dieses immense Kontextfenster ermöglicht es QWEN3-Coder, ganze Code-Repositorys zu verstehen und mit ihnen zu arbeiten, was es zu einem unschätzbaren Instrument für Entwickler macht.

Architektur von Qwen3-Codierer

QWEN3-Coder wird mit der Kernidee entwickelt, um die Agentencodierung zu übertreffen. Die Architektur und das Coaching sind so konzipiert, dass es ein erstklassiges Modell für Codegenerierung und Code-bezogene Aufgaben macht.

  • Expertenmischung (MOE): Das Modell verwendet eine MOE -Architektur mit 160 Experten, von denen 8 gleichzeitig aktiv sind. Dies ermöglicht es dem Modell, sehr groß und mächtig zu sein, ohne langsam zu sein.
  • Massives Kontextfenster: Mit der nativen Unterstützung für 256.000 Token kann QWEN3-CODER große Codemengen direkt verarbeiten. Dies ist oft entscheidend, um den Kontext eines ganzen Projekts zu verstehen.
  • Erweitertes Coaching: Das Modell wurde auf 7,5 Billionen Daten vorhanden, wobei 70% davon Code waren. Außerdem wurde eine Part nach der Ausbildung durchlaufen, die das Verstärkungslernen aus menschlichem Suggestions beinhaltete, um die Fähigkeit zu verbessern, mit realen Codierungsaufgaben umzugehen.

Dieses fortgeschrittene Coaching wurde durchgeführt, um eine breitere Sichtweise zu nutzen, anstatt sich auf die Codegeneration auf Wettbewerbsebene in der Neighborhood zu konzentrieren. Das obige Diagramm zeigt die stetigen Leistungsgewinne in einer Vielzahl von Benchmarks, einschließlich Codegenerierung, Softwareentwicklung, Datenanalyse, Wettbewerbsprogrammierung, mehrsprachiger Codierung, SQL-Programmierung, Codebearbeitung und Anweisungen. Diese konsequenten Aufwärtstrends zeigen die Wirksamkeit des Verstärkungslernens bei der Verbesserung der Verallgemeinerung des Modells zwischen strukturierten und unstrukturierten Codierungsherausforderungen.

Leistung von Qwen3-Codierer

Qwen3-Codierer erzielte im Vergleich zu anderen Open-Supply-Modellen auf dem SWE-Bench-Benchmark eine hochmoderne Agentenleistung. Wie in der Grafik gezeigt, erreicht es 69,6% überprüfte Genauigkeit in einer interaktiven Einstellung von 500 Drehungen und 67,0% im Single-Shot-Modus. Es übertraf andere Modelle wie Mistral-Small-2507 mit 53,6% und GPT-4,1 mit einer Genauigkeit von 54,6%. Es liegt knapp hinter Claude-sonnet-4 (70,4%) und vor Kimi-K2 (65,4%) und Gemini-2,5 (49,0%). Dadurch werden QWEN3-Codierer als das open-leistungsstärkste Open-Agent-Modell für Software program-Engineering-Aufgaben in der realen Welt festgelegt.

Erste Schritte mit Qwen Code

Um direkt auf Qwen Code zuzugreifen, gehen Sie zu https://chat.qwen.ai/Und dort können Sie QWEN3-CODER als Modell auswählen und es verwenden.

Erste Schritte mit Qwen Code

Qwen API

Sie können direkt auf die API von Qwen3-Codierer zugreifen Alibaba Cloud Mannequin Studio. Hier ist eine Demonstration, wie dieses Modell mit der Qwen -API verwendet wird. Ab sofort ist keine kostenlose Quote verfügbar.

import os

from openai import OpenAI

# Create shopper - utilizing intl URL for customers outdoors of China

# In case you are in mainland China, use the next URL:

# "https://dashscope.aliyuncs.com/compatible-mode/v1"

shopper = OpenAI(

   api_key=os.getenv("DASHSCOPE_API_KEY"),

   base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",

)

immediate = "Assist me create an internet web page for an internet bookstore."

# Ship request to qwen3-coder-plus mannequin

completion = shopper.chat.completions.create(

   mannequin="qwen3-coder-plus",

   messages=(

       {"position": "system", "content material": "You're a useful assistant."},

       {"position": "consumer", "content material": immediate}

   ),

)

# Print the response

print(completion.decisions(0).message.content material.strip())

Das QWEN-Workforce hat außerdem ein Befehlszeilen-Software namens QWEN Code veröffentlicht, um die Verwendung von QWEN3-Coder einfach zu verwenden. Hier finden Sie eine Schritt-für-Schritt-Anleitung, um Ihnen den Einstieg zu erleichtern:

Wie benutze ich Qwen Code?

Schritt 1: Installieren Sie Node.js

Zunächst müssen Sie Node.js Model 20 oder höher in Ihrem System installieren. Sie können es mit den folgenden Befehlen installieren. Öffnen Sie Ihr Terminal und fügen Sie die folgenden Befehle einzeln ein.

# Obtain and set up nvm:

curl -o- https://uncooked.githubusercontent.com/nvm-sh/nvm/v0.40.3/set up.sh | bash

# in lieu of restarting the shell

. "$HOME/.nvm/nvm.sh"

# Obtain and set up Node.js:

nvm set up 22

# Confirm the Node.js model:

node -v # Ought to print "v22.17.1".

nvm present # Ought to print "v22.17.1".

# Confirm npm model:

npm -v # Ought to print "10.9.2".

Schritt 2: Installieren Sie den Qwen -Code

Installieren Sie als Nächstes das QWEN -Code -Software mit dem NPM -Paket -Supervisor:

npm i -g @qwen-code/qwen-code

Sie sollten so etwas sehen:

  Installieren Sie node.js

Schritt 3: Konfigurieren Sie Ihre API -Style

Sie können direkt auf die API von Qwen3-Codierer zugreifen Alibaba Cloud Mannequin Studio. Ab sofort ist keine kostenlose Quote verfügbar.

Sie müssen Ihren API -Schlüssel einrichten, um das Modell zu verwenden. Sie können dies tun, indem Sie Umgebungsvariablen festlegen.

export OPENAI_API_KEY="your_qwen_api_key_here"

export OPENAI_BASE_URL="https://dashscope-intl.aliyuncs.com/compatible-mode/v1"

export OPENAI_MODEL="qwen3-coder-plus"

Schritt 4: Codieren beginnen

Jetzt sind Sie bereit, „Qwen Code“ zu verwenden. Sie können zu Ihrem Projektverzeichnis navigieren und mit dem Agenten interagieren. Um beispielsweise die Architektur eines Projekts zu verstehen, können Sie den Befehl verwenden oder einfach den folgenden Befehl schreiben. Qwen Code wird angezeigt:

qwen
Starten Sie die Codierung in Qwen Codierer

Sie können es auch für komplexere Aufgaben wie Refactoring -Code oder sogar die Automatisierung von Workflows verwenden.

Wie benutze ich Qwen3-Codierer im Claude-Code?

Zusätzlich zu Qwen Code können Sie jetzt QWEN3 -Coder mit Claude Code verwenden. Fordern Sie einfach einen API -Schlüssel an Alibaba Cloud Mannequin Studio Plattform und installieren Sie den Claude -Code, um die Codierung zu starten.

npm set up -g @anthropic-ai/claude-code

Arrange surroundings variables for utilizing Qwen3‑Coder

export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/api/v2/apps/claude-code-proxy

export ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey

Dann sollten Sie in der Lage sein, Claude Code mit QWEN3-CODER zu verwenden!

Notiz: Sie können entweder Qwen CLI oder Internet -Schnittstelle verwenden, um Codierungsaufgaben auszuführen. Lassen Sie uns nun einige Aufgaben ausführen, um QWEN3-Coder-Funktionen zu testen.

Praktische QWEN3-CODER

Wir haben Qwen3 -Coder auf einige interessante und komplexe Codierungsaufgaben getestet. Mal sehen, wie es sich leistete. Hier verwenden wir die UI -Model, die bei zugänglich ist https://chat.qwen.ai/

Aufgabe 1: Good Information Storytellerer

Immediate: Erstellen Sie eine Information Storytelling -App, in der Benutzer CSV -Dateien hochladen und Fragen zu ihren Daten stellen können. Die KI sollte Visualisierungen erzeugen, Muster identifizieren und narrative Erklärungen der Erkenntnisse erstellen. Fügen Sie Funktionen für Benutzer hinzu, um Observe-up-Fragen wie „Warum ist der Umsatz im dritten Quartal gesunken?“ Oder „zeigen Sie mir die Korrelation zwischen Marketingausgaben und Einnahmen.“ Machen Sie es nicht-technische Benutzer zugänglich.

Smart Data Storyteller

Es dauerte einige Zeit, um den Code zu generieren, aber die vollständige App in einem Skript generierte. Als wir den HTML -Viewer getestet haben, haben wir folgende Ergebnisse erhalten:

Smart Data Storyteller

Die Benutzeroberfläche der App ist interessant; Es wird erfolgreich verarbeitet, sodass die App Datei -Uploads verarbeiten kann. Die reichen UI -Komponenten werden mit React erstellt. Die App hat reaktionsschnell gestaltet und beweist daher, dass QWEN3-Coder in dieser Aufgabe eine gute Leistung erbringt.

Aufgabe 2: Debugging und Wiederbelebung eines komplexen, fehlgeschlagenen Codebasis

Immediate: Fungieren Sie als Senior Python Developer und Code Reviewer. Ich habe ein Python -Skript, das eine Liste von Benutzerdaten aus einer Schein -API verarbeiten, für aktive Benutzer filtert und ihr Durchschnittsalter berechnet. Es ist jedoch fehlerhaft, langsam und schlecht geschrieben. Ihre Aufgabe ist::

  • Identifizieren Sie die Fehler: Finden und hear Sie alle logischen Fehler, potenzielle Laufzeitfehler und schlechte Praktiken im Code auf.
  • Beheben Sie den Code: Geben Sie eine korrigierte Model des Skripts an, das wie beabsichtigt funktioniert.
  • Refaktor zur Verbesserung: Refactor den korrigierten Code, um seine Leistung, Lesbarkeit und Wartbarkeit zu verbessern. Insbesondere sollten Sie:
    • Fügen Sie für die API -Anforderung Fehlerbehandlung hinzu.
    • Verwenden Sie nach Möglichkeit eine effizientere Datenstruktur oder -methode.
    • Verbesserung der Variablennamen, um beschreibender zu sein.
    • Fügen Sie bei Bedarf Typ -Hinweise und Kommentare hinzu.
    • Strukturieren Sie den Code in Funktionen für eine bessere Organisation.

Hier ist der Buggy -Code:

import requests

def process_users():

    knowledge = ()

    # Inefficiently fetching one consumer at a time

    for i in vary(1, 101):

        # API endpoint is wrong and can fail for some customers

        response = requests.get(f"https://my-mock-api.com/customers/{i}")

        knowledge.append(response.json())

    total_age = 0

    active_users_count = 0

    for consumer in knowledge:

        # Bug: 'standing' key won't exist

        if consumer('standing') == 'lively':

            # Bug: 'profile' or 'age' won't exist, will elevate KeyError

            total_age += consumer('profile')('age')

            active_users_count += 1

    # Bug: Division by zero if no lively customers are discovered

    average_age = total_age / active_users_count

    print("Common age of lively customers:", average_age)

process_users()

Ausgabe:

QWEN 3 Coderausgabe

Qwen erzeugte die Lösung in einiger Zeit. Schauen wir uns das Ergebnis an:

  • Gute Dinge: Qwen fügte Fehlerbehebung und sicheren Datenzugriff für API -Eingaben hinzu. Code hat eine gute Dokumentation, die ihn lesbar macht. Der Code folgt Normal -Codestil.
  • Verbesserte Bereiche: Der Code ist aufgrund der zusätzlichen Fehlerbehandlung und -modularität länger und ausführlicher als das Authentic. Die Einführung von mehr Funktionen und Fehlerbehelden macht die Gesamtstruktur für Anfänger etwas komplexer.

Insgesamt ist der Code intestine und hat sich um alle Anweisungen kümmert.

Aufgabe 3: Solar Geländevisualisierung

Immediate: Erstellen Sie eine 3D -Solar -Terrain -Visualisierung mit einer einzelnen HTML -Datei, die CSS für Format und Themen enthält, und verwendet nur externe CDN -Bibliotheken – vor allem drei.js und Orbitcontrols – eine realistische, rotierende Sonne. Die Sonne sollte eine dynamische Oberflächenaktivität unter Verwendung animierter Beule oder Verschiebungskarten aufweisen, um Solargranulation und Fackeln zu simulieren, wodurch sie eine ungrierähnliche Textur verleiht. Fügen Sie einen dunklen Hintergrund zum Thema Area mit Sternen für den Umweltrealismus ein. Stellen Sie sicher, dass die Visualisierung interaktiv ist und die Drehung der Maus-Drehung und das Zooming von Scrollbasis unterstützt. Alle Texturen und Shader müssen aus öffentlichen CDNs oder Verfahrensgenerierungsmethoden ohne lokale oder hochgeladene Vermögenswerte bezogen werden.

Ausgabe:

Sonnengelände -Visualisierungsausgabe

Es generierte schnell einen HTML -Code. Als wir das in einem HTML -Betrachter getestet haben, haben wir Folgendes bekommen:

Qwen 3 Ausgabe

Es schuf ein interaktives 3D -Sonnengelände, das sich dreht. Die gelbe halbkreisförmige Struktur ist laut Qwen eine Fackel. Diese Animation ist etwas vielversprechend, aber nicht zu intestine.

Es hat auch einige Optionen in der linken Ecke der Down -Ecke bereitgestellt, um die Rotation zu pausieren, die Ansicht zurückzusetzen und Fackeln auszublenden. Das folgende Bild zeigt die Sonne ohne Fackeln:

QWEN3 Ausgang

Die Ausgabe dieser Aufgabe ist intestine, aber nicht bis zur Marke. Es gibt einige Bereiche, die Sie hier verbessern können. Vielleicht kann es gelöst werden, indem es eine detailliertere Eingabeaufforderung zur Verfügung stellt.

Abschluss

QWEN3-CODER stellt einen enormen Durchbruch in Open-Supply-KI-Modellen innerhalb der Domäne der Codegenerierung dar. Seine leistungsstarke Architektur, ein massives Kontextfenster und die agierenden Fähigkeiten machen es zu einem wertvollen Instrument für Entwickler und Forscher. Da das Modell weiterhin entwickelt wird, werden wir in Zukunft noch beeindruckendere Funktionen und Leistung erwarten. Dieses Open-Supply-KI-Modell hat einen erheblichen Einfluss darauf, wie wir Softwareentwicklungsprobleme angehen und es effizienter und automatischer machen.

Häufig gestellte Fragen

Q1. Was ist der Hauptvorteil der MEE-Architektur (Mee-of-Consultants) von QWEN3-CODER?

A. Die MOE -Architektur ermöglicht es dem Modell, eine sehr große Anzahl von Parametern (480 Milliarden) zu haben, während nur einen Bruchteil von ihnen (35 Milliarden) gleichzeitig aktiviert wird. Dies führt zu einem leistungsstarken Modell, das effizienter zu betreiben ist.

Q2. Welche Bedeutung hat das große Kontextfenster?

A. Das 256.000-geölte Kontextfenster (erweiterbar auf 1 Million) ermöglicht es QWEN3-Coder, ganze Code-Repositorys zu verarbeiten und zu verstehen, was für komplexe Aufgaben von entscheidender Bedeutung ist, die ein tiefes Verständnis des Kontextes des Projekts erfordern.

Q3. Was ist Qwen Code?

A. Qwen Code ist ein Befehlszeilen-Software, das mit QWEN3-Coder funktioniert. Es bietet eine bequeme Schnittstelle für die Interaktion mit dem Modell für verschiedene Codierungsaufgaben.

This fall. Wie vergleicht Qwen3-Codierer mit anderen Codegenerierungsmodellen?

A. QWEN3-CODER hat eine modernste Leistung unter Open-Supply-Modellen auf mehreren Benchmarks, einschließlich SWE-Bench, nachgewiesen. Seine Fähigkeiten sind vergleichbar mit einigen der besten verfügbaren proprietären Modelle.

Q5. Wo kann ich auf das QWEN3-CODER-Modell zugreifen?

A. Das QWEN3-CODER-Modell ist im Umarmungs-Face-Hub verfügbar. Weitere Informationen und Ressourcen finden Sie im offiziellen QWEN-Weblog und im GitHub-Repository.

Harsh Mishra ist ein KI/ML -Ingenieur, der mehr Zeit damit verbringt, mit großen Sprachmodellen zu sprechen als mit tatsächlichen Menschen. Leidenschaft über Genai, NLP und Maschinen schlauer (damit sie ihn noch nicht ersetzen). Wenn er Fashions nicht optimiert, optimiert er wahrscheinlich seine Kaffeeaufnahme. 🚀☕

Melden Sie sich an, um weiter zu lesen und Experten-Kuratinhalte zu genießen.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert