Sechzehn autonome KI-Agenten. Zwei Wochen ununterbrochene Ausführung. Quick 100.000 Zeilen Rust-Code. Das battle es, was Anthropic brauchte, um einen funktionierenden C-Compiler zu entwickeln, der in der Lage battle, große reale Projekte wie den Linux-Kernel zu kompilieren. Hier gibt es jedoch einen Kicker. Das Projekt, das intern als Claudes „Agententeams“ bezeichnet wird, wurde nicht von einem menschlichen Ingenieurteam geschrieben. Es wurde von einem koordinierten Schwarm parallel arbeitender Claude-Agenten entwickelt, quick völlig ohne menschliches Zutun.
Aber seien Sie sich dessen bewusst: Dies battle keine automatische Vervollständigung bei Steroiden oder ein Chatbot, der zufällige Funktionen zusammenfügt. Die Claude-Agenten arbeiteten wie ein echtes Ingenieursteam, indem sie den Compiler in Module aufteilten, Verantwortlichkeiten zuwiesen, Komponenten schrieben, Testsuiten ausführten, Fehler behoben und kontinuierlich iterierten. Und das macht dies zu einem wichtigen Meilenstein im Zeitalter der KI-Entwicklung (Lernen Sie KI kostenlos). Was genau passiert ist und wie wichtig es ist, wollen wir in diesem Artikel untersuchen.
TL;DR
Sehen Sie sich stattdessen dieses Video an:
Was Anthropic gebaut hat
Im Kern zielte das Projekt von Anthropic darauf ab, einen vollständigen C-Compiler von Grund auf zu erstellen, aber, *warten Sie*, nur KI-Agenten zu verwenden. Dies battle kein Spielzeugdolmetscher oder eine Unterrichtsdemo. Dies battle ein echter Compiler, der Arbeitslasten auf Produktionsebene bewältigen konnte. Der Claude C Compiler wurde in Rust geschrieben und entwickelt, um C-Programme in ausführbaren Maschinencode auf wichtigen Architekturen wie x86-64 und ARM zu übersetzen.
Und dies wurde nicht an einfachen „Hey World“-Programmen getestet. Es wurde hart gedrängt. Der Compiler bewältigte erfolgreich große, komplexe Codebasen wie den Linux-Kernel und andere weit verbreitete Open-Supply-Projekte. Es hat auch einen erheblichen Teil der Folter-Testsuite von GCC bestanden, bei der es sich um eine brutale Sammlung von Randfällen handelt, die darauf ausgelegt sind, C-Compiler zu zerstören. Das macht diese Leistung so beeindruckend. Etwas zu bauen, das funktioniert, ist eine Sache. Eine andere Sache ist es, etwas zu entwickeln, das die von professionellen Compiler-Ingenieuren durchgeführten Stresstests übersteht.
Wie anthropisch es geschafft hat
Wie bringt man KI-Agenten dazu, etwas so Komplexes wie einen C-Compiler zu erstellen?
Der Schlüssel lag darin, sich nicht darauf zu verlassen, dass ein einzelnes Modell in einer Schleife läuft. Stattdessen setzten sie ein Staff von 16 parallel arbeitenden Claude-Agenten ein. Stellen Sie sich das so vor, als würden Sie ein kleines Ingenieurteam gründen, mit dem Unterschied, dass jeder Ingenieur eine KI-Instanz ist. Jeder Agent erhielt strukturierte Aufgaben, klare Ziele und Zugriff auf die gemeinsame Codebasis. Diese Agenten koordinierten dann hochspezifischen Code, um einen funktionierenden, erfolgreichen C-Compiler zu erstellen.
Die Orchestrierung battle eine weitere Säule. Zu diesem Zweck baute Anthropic ein System rund um die Agenten auf – eine kontrollierte Umgebung, in der sie Code schreiben, Exams ausführen, Fehler sehen, Probleme beheben und iterieren konnten. Wenn additionally etwas kaputt ging, machten die Agenten nicht Halt. Stattdessen wurde ein Debugging durchgeführt. Als die Exams fehlschlugen, überarbeiteten sie. Diese kontinuierliche Rückkopplungsschleife fungierte wie ein eingebautes Qualitätskontrollsystem.
Parallelität hat auch einen großen Unterschied gemacht. Während ein Agent an der Analyse der Logik arbeitete, konnte ein anderer die Codegenerierung übernehmen und wieder andere konzentrierten sich auf die Optimierung oder Fehlerbehebung. Anstelle eines linearen Fortschritts erfolgte die Entwicklung gleichzeitig an mehreren Fronten, was den Prozess erheblich beschleunigte.
Das battle keine Zauberei. Es battle strukturierte Autonomie.
Warum das eine große Sache ist
Compiler bilden die Grundlage der Datenverarbeitung. Jede von Ihnen verwendete App, jedes Betriebssystem, jeder Backend-Dienst durchläuft irgendwann einen Compiler. Der Aufbau eines solchen Programs gilt als ernsthafte systemtechnische Arbeit, eine Aufgabe für Entwickler mit den höchsten Fähigkeiten. Es erfordert ein tiefes Verständnis des Sprachdesigns, der Speicherverwaltung, Optimierungsstrategien, Architekturunterschiede und unzähliger Randfälle.
Wenn additionally KI-Agenten innerhalb von Wochen einen funktionierenden C-Compiler erstellen, signalisiert das einen gewaltigen Wandel.
Bis vor kurzem waren KI-Codierungstools (Schauen Sie sich hier die Prime 10 an) waren Assistenten. Bei max halfen sie Entwicklern beim Schreiben von Funktionen, schlugen Refaktoren vor oder generierten Boilerplates. Aber dieses Projekt ist der wahre Beweis dafür, dass KI mehrstufige, hochkomplexe Engineering-Aufgaben mit strukturierter Iteration und Exams bewältigen kann.
Wenn man darüber nachdenkt, kann dies die Softwareentwicklung, wie wir sie kennen, verändern.
Anstatt zu fragen: „Kann KI mir beim Schreiben dieser Funktion helfen?“ Die neue Frage lautet: „Kann KI einen gesamten Systemaufbau koordinieren und ausführen?“ Und wenn Compiler möglich sind, erstrecken sich die Möglichkeiten jetzt auf Datenbanken. Betriebssystemeund sogar umfassende Unternehmenstools.
Was es (noch) nicht kann
So beeindruckend das auch ist, der Claude C Compiler wird GCC oder Clang in absehbarer Zeit nicht ersetzen. Warum?
Zunächst einmal handelt es sich nicht um einen vollständig ausgereiften Compiler für die Produktion. Obwohl es den Linux-Kernel erfolgreich kompiliert und viele Belastungstests bestanden hat, unterstützt es noch nicht jeden Randfall oder jede Architekturvariante, die jahrzehntealte Compiler verarbeiten. Einige Low-Degree-Funktionen, wie z. B. bestimmte ältere x86-Verhaltensweisen, sind immer noch eingeschränkt. Auch für Teile der Toolchain, etwa für den Zusammenbau und die Verknüpfung, greift es auf vorhandene Instruments zurück.
Leistungsoptimierung ist ein anderer Bereich. Etablierte Compiler wurden jahrelang oder sogar jahrzehntelang verfeinert. Damit quetschen sie jedes Quäntchen Effizienz heraus. Der von Claude erstellte Compiler funktioniert, ist jedoch nicht unbedingt auf dieser Ebene optimiert.
Aber das ist okay.
Bei Anthropics Check geht es nicht um Perfektion. Es ging darum zu prüfen, ob das überhaupt möglich ist. Was wir hier sehen, sind autonome Systeme im Frühstadium, die bereits tiefgreifende technische Infrastrukturaufgaben bewältigen. Wenn es sich um Model eins handelt, können wir uns nur vorstellen, was Model fünf leisten kann.
Und hier wird es interessant.
Was kommt als nächstes?
In seinen Schlussbemerkungen innerhalb der WeblogNicholas Carlini, der Autor des Experiments und Forscher im Safeguards-Staff von Anthropic, teilt mit, dass das Experiment und seine Ergebnisse ihn zwar begeistern, ihm aber auch ein „Unwohlsein“ bereiten. Er hebt hervor, dass der Einsatz von KI für die Entwicklung bisher einem gemeinsamen Verfahren folgte: Ein Benutzer definiert eine Aufgabe, ein LLM erledigt sie und kehrt zurück, um eine Antwort zu erhalten.
Die völlig autonome Entwicklung durch die Claude-Agenten ändert das.
Stellen Sie sich das so vor – die wahre Geschichte hier ist nicht nur, dass die KI einen Compiler gebaut hat. Es geht darum, dass KI ein komplexes, langfristiges technisches Projekt mit Struktur, Iteration und Koordination verwaltet hat. Und das Ergebnis battle ein solider, funktionierender C-Compiler.
Heute ist es ein C-Compiler. Morgen könnten es ganze Backend-Systeme, verteilte Infrastrukturen, Simulations-Engines oder domänenspezifische Sprachen sein. Sobald Sie beweisen, dass Agenten ohne ständige menschliche Aufsicht zusammenarbeiten, sich selbst testen, Fehler beheben und weiterarbeiten können, erweitert sich der Anwendungsbereich schnell, und ich wage es zu sagen, ins Unendliche.
Carlini weist hier auf eine echte Bedrohung hin. Er sagt, dass es „leicht zu sehen ist, dass Exams bestanden werden, und davon auszugehen, dass die Arbeit erledigt ist“, wenn solche autonomen Systeme im Einsatz sind. Dies ist jedoch selten der Fall, und in den meisten Fällen gibt es Schwachstellen in solchen Systemen, die von Menschen überprüft werden müssen, bevor ein solches Programm zum Leben erweckt wird.
Während das Experiment additionally einen völlig neuen Horizont an Möglichkeiten aufzeigt, müssen wir sorgfältig überlegen, wie wir es in der kommenden Zeit in die Praxis umsetzen.
Abschluss
Für Entwickler muss ich Folgendes sagen: Bitte betrachten Sie diese Entwicklung nicht als „Sport Over“. Es bedeutet einfach, dass sich Ihre Rolle als Entwickler jetzt weiterentwickelt. Anstatt jede Zeile zu schreiben, können Sie zunehmend das System entwerfen, Einschränkungen definieren, Bewertungssysteme erstellen und Agententeams beaufsichtigen. Noch wichtiger ist, dass Sie solche Systeme auf jeden Fall auf Schwachstellen überprüfen müssen. Der von seinen Agenten erstellte Claude-C-Compiler zeigt uns eine Vorschau auf diese Zukunft.
KI hilft nicht mehr nur beim Schreiben von Code. Es beginnt mit dem Aufbau von Systemen. Und das ist eine ganz andere Liga.
Melden Sie sich an, um weiterzulesen und von Experten kuratierte Inhalte zu genießen.
