Konzentrieren Sie sich auf isolierte Aufgaben oder einfaches zeitnahes Engineering. Dieser Ansatz ermöglichte es uns, interessante Anwendungen aus einer einzigen Eingabeaufforderung zu erstellen, aber wir stoßen langsam an eine Grenze. Einfache Eingabeaufforderungen greifen zu kurz, wenn wir komplexe KI-Aufgaben bewältigen, die mehrere Stufen erfordern, oder Unternehmenssysteme, die Informationen schrittweise berücksichtigen müssen. Der Wettlauf um AGI kann als Skalierung vorhandener Modellparameter, als Durchbruch in der Architektur oder als Zusammenarbeit mehrerer Modelle angesehen werden. Während die Skalierung teuer und auf die Fähigkeiten vorhandener Modelle beschränkt ist und Durchbrüche nicht messbar sind und zu jedem Zeitpunkt auftreten können, ist die Orchestrierung mehrerer Modelle nach wie vor der beste Weg, intelligente Systeme aufzubauen, die wie Menschen komplexe Aufgaben ausführen können.
Eine Type der Intelligenz ist die Fähigkeit von Agenten, mit minimalem Eingriff andere Agenten aufzubauen, wobei die KI die Freiheit hat, auf Anfrage zu handeln. In dieser neuen Part übernimmt die maschinelle Intelligenz die komplexe Blaupause, während der Mensch auf dem Laufenden bleibt, um die Sicherheit zu gewährleisten.
Entwerfen für die Maschine-zu-Maschine-Integration
Wir brauchen eine Standardmethode für die Kommunikation zwischen Maschinen, ohne dass ein Mensch für jede einzelne Verbindung benutzerdefinierte Integrationen schreiben muss. Hier wird das Mannequin Context Protocol (MCP) zu einem wichtigen Bestandteil des Stacks. MCP dient als universelle Schnittstelle für Modelle zur Interaktion mit vorhandenen Umgebungen, z. B. zum Aufrufen von Instruments, zum Abrufen von APIs oder zum Abfragen von Datenbanken. Auch wenn dies autonom erscheinen magazine, erfordert der Ingenieur einen erheblichen manuellen Arbeitsaufwand, um den MCP für das Modell oder den Agenten zu definieren.
Außerdem ist ein topologischer Rahmen unerlässlich, um die Logik der Agenteninteraktionen als Teil der Autonomiereise zu steuern. Agenten in einer chaotischen offenen Welt arbeiten zu lassen, führt zu Halluzinationen und einer Aufblähung der erforderlichen Arbeit. Allerdings kann ein graphbasiertes Framework den Ausführungsfluss organisieren. Wenn wir Modelle als Knoten und ihre Interaktionen als Kanten behandeln, können wir damit beginnen, die Abhängigkeiten und den Datenfluss im gesamten System zu visualisieren. Wir können auf dem Diagramm und dem MCP-Blueprint aufbauen, um Planer-Agenten zu erstellen, die innerhalb des Frameworks arbeiten, um Blueprints zur Lösung von Problemen zu generieren, indem wir komplexe Ziele autonom in umsetzbare Aufgabensequenzen zerlegen. Der Planer-Agent identifiziert, was benötigt wird, das graphbasierte Framework organisiert die Abhängigkeiten, um Halluzinationen vorzubeugen, und generiert Agenten, um Ihre Ziele zu erreichen; nennen wir sie „Vibe-Agenten“.
Intelligenz mit Vibe Brokers
Beim Übergang von einer autonomen Theorie zu einem vollständig funktionierenden System benötigen wir eine Möglichkeit, „Vibe“-Anweisungen auf hoher Ebene in ausführbare Diagramme umzuwandeln. Der Benutzer gibt eine Absicht an und das System verwandelt sie in ein Crew von Agenten, die zusammenarbeiten, um das Ergebnis zu erzielen. Im Gegensatz zu vielen Multi-Agent-Systemen, die durch freie Konversation koordinieren, arbeiten Vibe-Agenten in einem expliziten Diagramm, in dem Abhängigkeiten und Ausführungspfade strukturiert und beobachtbar sind. Dies ist das Downside, an dessen Lösung ich als Betreuer des Open-Supply-Frameworks IntelliNode (Apache-Lizenz) gearbeitet habe. Es basiert auf einem Planer-Agenten, der den Diagrammentwurf aus der Absicht des Benutzers generiert und ihn dann ausführt, indem er Daten zwischen Agenten weiterleitet und die endgültigen Ergebnisse sammelt.
IntelliNode bietet Vibe-Agenten ein Zuhause und ermöglicht es ihnen, nicht ausschließlich als statische Skripte zu existieren, sondern als fließende Teilnehmer innerhalb eines sich entwickelnden Arbeitsablaufs zu fungieren.
In IntelliNode erstellte Vibe-Agenten stellen unseren ersten experimentellen Versuch dar, eine autonome Ebene zu erstellen. Im Wesentlichen möchten wir einen Prozess schaffen, bei dem die Definition jeder Aufgabe durch deklarative Orchestrierung, die Beschreibung des gewünschten Ergebnisses, erfolgt. Durch den Einsatz dieses Frameworks ermöglichen wir Benutzern die Erstellung von Eingabeaufforderungen, die es orchestrierten Agenten ermöglichen, außergewöhnlich komplexe Aufgaben anstelle einfacher fragmentierter Aufgaben auszuführen.
Anwendungsfall: Die autonome Analysis-to-Content material-Fabrik

In einem herkömmlichen Arbeitsablauf erfordert die Erstellung eines Deep-Dive-Berichts oder technischen Artikels einen erheblichen Aufwand für die Zusammenstellung von Suchergebnissen, die Datenanalyse und den Entwurf. In diesem Rahmen besteht der Engpass im Arbeitsablauf darin, dass jede durchgeführte Aktion Eingaben von anderen Ebenen erfordert.
Bei der Implementierung von Vibe Brokers werden wir in der Lage sein, eine selbstorganisierende Pipeline zu etablieren, die sich auf die Nutzung aktueller Dwell-Daten konzentriert. Wenn jemand eine Absicht auf hoher Ebene anfordert, gibt er die folgende einzelne Aussage ab: „Recherchieren Sie die neuesten Durchbrüche bei Festkörperbatterien der letzten 30 Tage und erstellen Sie eine technische Zusammenfassung mit einer unterstützenden Diagrammbeschreibung.“
Wie das IntelliNode Framework „Vibe“ ausführt

Wenn der Architekt diese Absicht erhält, generiert er nicht nur Code, sondern spontan einen benutzerdefinierten Blueprint:
- Der Scout (Suchagent): verwendet google_api_key, um Echtzeitabfragen im Web durchzuführen.
- Der Analyst (Textagent): verarbeitet die Ergebnisse der Abfragen und extrahiert alle technischen Spezifikationen aus den Rohausschnitten
- Der Ersteller (Picture Agent): erstellt den Abschlussbericht, erstellt ein Structure oder stellt eine visuelle Darstellung der Ergebnisse bereit.
Anstatt Code zu schreiben und eine API-Verbindung zu erstellen, um Ihre Absicht auszuführen, stellen Sie der Maschine die Absicht zur Verfügung und sie stellt das zur Erfüllung dieser Absicht erforderliche spezialisierte Crew zusammen.
Implementierung mit VibeFlow
Der folgende Code zeigt, wie der Übergang von natürlicher Sprache zu einer vollständig orchestrierten Such- und Inhaltspipeline gehandhabt wird.
1. Richten Sie Ihre Umgebung ein
Legen Sie Ihre API-Schlüssel als Umgebungsvariablen fest, um den Architekten und die autonomen Agenten zu authentifizieren.
export OPENAI_API_KEY="your_openai_key"
export GOOGLE_API_KEY="your_google_cloud_key"
export GOOGLE_CSE_ID="your_search_engine_id"
export GEMINI_API_KEY="your_gemini_key"
Installieren Sie IntelliNode:
pip set up intelli -q
2. Initialisieren Sie den Architekten
import asyncio
import os
from intelli.circulation.vibe import VibeFlow
# Initialize with planner and most popular mannequin settings
vf = VibeFlow(
planner_api_key=os.getenv("OPENAI_API_KEY"),
planner_model="gpt-5.2",
image_model="gemini gemini-3-pro-image-preview"
)
3. Definieren Sie die Absicht
Ein „Vibe“ ist eine deklarative Aussage auf hoher Ebene. Der Architekt analysiert dies und entscheidet, welche spezialisierten Agenten zur Erfüllung der Mission erforderlich sind.
intent = (
"Create a 3-step linear circulation for a 'Analysis-to-Content material Manufacturing unit': "
"1. Search: Carry out an online analysis utilizing ONLY 'google' as supplier for solid-state battery breakthroughs within the final 30 days. "
"2. Analyst: Summarize the findings into key technical metrics. "
"3. Creator: Generate a picture utilizing 'gemini' displaying a futuristic illustration of those battery findings."
)
# Construct the staff and the visible blueprint
circulation = await vf.construct(intent)
4. Führen Sie die Mission aus
Die Ausführung übernimmt die Orchestrierung, den Datenaustausch zwischen Agenten und das automatische Speichern aller generierten Bilder und Zusammenfassungen.
# Configure output listing and computerized saving
circulation.output_dir = "./outcomes"
circulation.auto_save_outputs = True
# Execute the autonomous manufacturing facility
outcomes = await circulation.begin()
print(f"Outcomes saved to {circulation.output_dir}")
Agentensysteme verlagern sich schnell von „prompten Methods“ zu Softwarearchitekturen, und die entscheidende Frage ist nicht mehr, ob mehrere Agenten zusammenarbeiten können, sondern vielmehr, wie diese Zusammenarbeit in der Produktion eingeschränkt und repliziert wird. Viele erfolgreiche Systeme verwenden eine konversationsähnliche Agentenkoordination, die beim Prototyping sehr nützlich ist, aber bei komplexer werdenden Arbeitsabläufen schwer zu bedenken ist. Andere verfolgen einen fortschrittlicheren Workflow-Ansatz, beispielsweise die diagrammbasierte Ausführung.
Die Idee hinter Vibe Brokers besteht darin, die Absicht des Benutzers in Diagrammen zusammenzufassen, die ausgeführt und nachverfolgt werden können, sodass die Reihenfolge von Anfang bis Ende beobachtbar ist. Das bedeutet viel weniger Handarbeit und mehr Arbeit mit dem Bauplan, den dieses System generiert.
Referenzen
https://www.anthropic.com/information/model-context-protocol
