# Korruption mit Delegation
Wir treten in eine neue KI-Ära ein, in der die Interaktion zur Realität wird Arbeitsdelegation. Benutzer chatten nicht nur mit einer KI, die ihre Fragen beantwortet: Sie delegieren auch zunehmend Aufgaben über einen längeren Zeitraum – von der Bearbeitung des Quellcodes über die Formatierung professioneller Texte bis hin zur Verwaltung von Buchhaltungsbüchern. Daher vertrauen sie KI-Systemen in einem beispiellosen Ausmaß, um die Integrität von Dateien wie Dokumenten über mehrere Interaktionen hinweg aufrechtzuerhalten.
Eine aktuelle Studie zeigte jedoch ein Drawback auf. Beim Delegieren von Aufgaben an a großes Sprachmodell (LLM)kann es dazu kommen, dass Dokumente, die Sie ihm übergeben haben, stillschweigend beschädigt werden. Um dieses Drawback zu verstehen, haben die Wissenschaftler in diese Studiedessen Ergebnisse wir zusammenfassen, hat einen strengen Bewertungsrahmen namens „DELEGATE-52“ erstellt. Dieser Benchmark umfasst 52 Fachbereiche: von juristischen Texten bis hin zu Python-Codierung, Musiknotation oder Kristallographie.
Die Autoren testeten insgesamt 19 verschiedene LLMs mit einer intelligenten Simulationsmethode, die auf einem „Spherical-Journey“-Ansatz basierte und die KI aufforderte, eine bestimmte Bearbeitung durchzuführen, gefolgt von der genauen umgekehrten Anweisung, die Bearbeitungen rückgängig zu machen. Im Idealfall würde das Modell das Originaldokument so zurückgeben, wie es conflict – völlig intakt. Der Realitätscheck: Selbst die intelligentesten Modelle wie Gemini Professional, Claude Opus und GPT-5 sind in der Lage, nach 20 Interaktionen 25 % des ursprünglichen Dokumentinhalts zu beschädigen; schwächere Modelle können bis zu 50 % erreichen.
# Warum Modelle Ihre Dokumente beschädigen
Lassen Sie uns mehrere Gründe analysieren, warum das zuvor erläuterte Phänomen des strukturellen Inhaltsverfalls auftreten kann. Die Forscher haben mehrere Gründe dafür aufgedeckt:
// 1. Zusammengesetzte Fehler
Genau wie beim traditionellen „Telefonspiel“ können sich kleine Fehler, die LLMs machen, stillschweigend verschlimmern und heimtückisch bedeutsam werden. Eine einzelne Bearbeitung kann zu einigen wenigen, lokalisierten Fehlern führen, aber eine Folge komplexer Bearbeitungen kann das Drawback auf lange Sicht verschlimmern und im Laufe der Zeit zu einer drastischen Verschlechterung des Dokuments führen.
// 2. Schwache Modelle löschen, kluge halluzinieren
Im Studiewird eine bemerkenswerte Veränderung in der Artwork und Weise hervorgehoben, wie bestimmte Modelltypen scheitern. Bei schwächeren Modellen kommt es tendenziell zu Löschvorgängen, d. h. versehentlichem Löschen von Inhalten, wodurch sich das Drawback nach mehreren Interaktionen aufgrund einer offensichtlichen Verkleinerung des gesamten Dokumentinhalts bemerkbar macht. Bei Frontier-LLMs liegt das Hauptproblem jedoch nicht in der Löschung, sondern in der Korruption: Sie behalten das allgemeine „Aussehen und Gefühl“ der Dokumente bei und behalten sogar eine nahezu intakte Wortzahl bei, aber sie geben stillschweigend sachliche Informationen falsch ein, ändern sie oder ersetzen sie durch Fälschungen, die immer noch plausibel klingen. Hier liegt die Ironie: Je intelligenter das Modell, desto schwieriger wird es, sein korruptes Verhalten zu erkennen, da die Endausgabe auf den ersten Blick immer noch legitim aussieht.
// 3. Kontextüberlastung und ablenkende Bindungen
In einem chaotischen Zustand – mit vielen Kontextinformationen oder übermäßig vielen angehängten Dokumenten – haben Modelle Schwierigkeiten, die Informationen strukturell intakt zu halten. Wenn die Dokumentgröße zunimmt oder mehr „Ablenkungsdateien“ in den Eingabeaufforderungskontext einbezogen werden, steigen die Schwere und Auswirkungen der Verschlechterung sprunghaft an, wodurch der Überblick über genaue Particulars verloren geht und Lücken auf der Grundlage der Vorhersagelogik geschlossen werden. Das Modell hält sich nicht mehr an den Quelltext, da es leichter zu erraten ist.
// 4. Die Bedeutung der Domänenvertrautheit
Ein letzter Grund, warum Modelle bei komplexen Interaktionen mit Delegation dazu neigen, Dokumente zu verschlechtern, hängt mit der Artwork des Anwendungsfalls zusammen und damit, wie vertraut das Modell damit ist.
Bei delegierungsbasierten Aufgaben verschlechtern sich nicht alle Dateien im gleichen Ausmaß. Der Studie zufolge funktionieren LLMs in stark strukturierten, programmatischen Domänen wie Python-Quellcode intestine. Wenn sie auf rein natürliche Sprachaufgaben oder räumliche Nischenformatierungen angewiesen sind, verlieren sie schnell das strikte Gespür für die interne Logik, die erforderlich ist, um Dateien völlig intakt zu halten.
# Hilft Agentic AI?
Selbst wenn LLMs durch die Ausstattung mit Agenten-Instruments aufgerüstet werden – etwa mit der Möglichkeit, Code auszuführen oder Dateien direkt zu lesen und zu schreiben –, verschwindet das Drawback der delegierungsbasierten Dokumentenbeschädigung und -verfall nicht. Tatsächlich tragen Agenten-Add-Ons kaum oder gar nicht dazu bei, ein Drawback zu verhindern, das im Kern der Transformatorarchitektur auftritt, die LLMs zugrunde liegt. Es ist notwendig, darüber nachzudenken, wie langfristige KI-Aufgaben überprüft werden sollten. Bis dahin bleibt der Einsatz von LLMs als völlig unbeaufsichtigte Dokumenteneditoren ein riskantes Unterfangen.
Iván Palomares Carrascosa ist ein führender Autor, Redner und Berater in den Bereichen KI, maschinelles Lernen, Deep Studying und LLMs. Er schult und leitet andere darin, KI in der realen Welt zu nutzen.
