Da sich die Branche von einfachen LLM-Inferenzen (Giant Language Mannequin) hin zu autonomen Agentensystemen bewegt, haben sich die Herausforderungen für Entwickler verändert. Es geht nicht mehr nur um das Modell; es geht um die Umgebung, in der dieses Modell funktioniert. Ein Forscherteam von Alibaba veröffentlicht CoPawein Open-Supply-Framework, das dieses Downside lösen soll, indem es eine standardisierte Workstation für die Bereitstellung und Verwaltung persönlicher KI-Agenten bereitstellt.

CoPaw basiert auf einem technischen Stack bestehend aus AgentScope, AgentScope-LaufzeitUnd ReMe. Es fungiert als Brücke zwischen der Agentenlogik auf hoher Ebene und den praktischen Anforderungen eines persönlichen Assistenten, wie z. B. persistenter Speicher, Mehrkanalkonnektivität und Aufgabenplanung.

Die Architektur: AgentScope- und ReMe-Integration

CoPaw ist kein eigenständiger Bot, sondern eine Workstation, die mehrere Komponenten orchestriert, um eine zusammenhängende „Agenten-App“ zu erstellen.

Das System basiert auf drei Hauptschichten:

  1. AgentScope: Das zugrunde liegende Framework, das die Agentenkommunikation und -logik verwaltet.
  2. AgentScope-Laufzeit: Die Ausführungsumgebung, die einen stabilen Betrieb und ein stabiles Ressourcenmanagement gewährleistet.
  3. ReMe (Speicherverwaltung): Ein spezialisiertes Modul, das sowohl lokalen als auch cloudbasierten Speicher verwaltet. Dadurch können Agenten eine „Langzeiterfahrung“ aufrechterhalten und das mit Customary-LLM-APIs verbundene Downside der Zustandslosigkeit lösen.

Durch Hebelwirkung ReMeMit CoPaw können Benutzer ihren Datenschutz kontrollieren und gleichzeitig sicherstellen, dass der Agent den Kontext über verschiedene Sitzungen und Plattformen hinweg behält. Dieser dauerhafte Speicher ermöglicht es der Workstation, sich im Laufe der Zeit an die spezifischen Arbeitsabläufe eines Benutzers anzupassen.

Erweiterbarkeit über das Abilities System

Ein Kernmerkmal der CoPaw-Workstation ist ihre Kompetenzerweiterung Fähigkeit. In diesem Rahmen ist eine „Fähigkeit“ eine diskrete Funktionseinheit – im Wesentlichen ein Werkzeug, das der Agent aufrufen kann, um mit der Außenwelt zu interagieren.

Das Hinzufügen von Funktionen zu CoPaw erfordert keine Änderung der Kern-Engine. Stattdessen unterstützt CoPaw a Benutzerdefiniertes Ability-Verzeichnis wo Ingenieure Python-basierte Funktionen löschen können. Diese Fähigkeiten folgen einer standardisierten Spezifikation (beeinflusst von anthropics/expertise), wodurch der Agent Folgendes tun kann:

  • Führen Sie Net Scraping durch (z. B. Zusammenfassung von Reddit-Threads oder YouTube-Movies).
  • Interagieren Sie mit lokalen Dateien und Desktop-Umgebungen.
  • Fragen Sie persönliche Wissensdatenbanken ab, die auf der Workstation gespeichert sind.
  • Verwalten Sie Kalender und E-Mails in natürlicher Sprache.

Dieses Design ermöglicht die Erstellung von Agentische Apps– komplexe Arbeitsabläufe, bei denen der Agent eine Kombination aus integrierten Fähigkeiten und geplanten Aufgaben nutzt, um ein Ziel autonom zu erreichen.

Multi-Channel-Konnektivität (All-Area-Zugriff)

Eine der größten technischen Hürden bei der persönlichen KI ist der Einsatz auf fragmentierten Kommunikationsplattformen. CoPaw begegnet diesem Downside durch seine All-Area-Zugriff Schicht, die standardisiert, wie Agenten mit verschiedenen Messaging-Protokollen interagieren.

Derzeit unterstützt CoPaw die Integration mit:

  • Unternehmensplattformen: DingTalk und Lark (Feishu).
  • Soziale/Entwicklerplattformen: Discord, QQ und iMessage.

Diese Mehrkanalunterstützung bedeutet, dass ein Entwickler eine einzelne CoPaw-Instanz initialisieren und von jedem dieser Endpunkte aus mit ihr interagieren kann. Die Workstation übernimmt die Übersetzung von Nachrichten zwischen der Logik des Agenten und der API des spezifischen Kanals und sorgt für einen konsistenten Zustand und Speicher, unabhängig davon, wo die Interaktion stattfindet.

Wichtige Erkenntnisse

  • Wechsel vom Modell zur Workstation: CoPaw verlagert den Fokus weg vom reinen Giant Language Mannequin (LLM) hin zu einem strukturierten Modell Workstation-Architektur. Es fungiert als Middleware-Schicht, die das orchestriert AgentScope Rahmen, AgentScope-Laufzeitund externe Kommunikationskanäle, um die reinen LLM-Funktionen in einen funktionalen, dauerhaften Assistenten zu verwandeln.
  • Langzeitgedächtnis über ReMe: Im Gegensatz zu standardmäßigen zustandslosen LLM-Interaktionen integriert CoPaw die ReMe (Speicherverwaltung) Modul. Dadurch können Agenten eine „Langzeiterfahrung“ aufrechterhalten, indem sie Benutzerpräferenzen und vergangene Aufgabendaten entweder lokal oder in der Cloud speichern und so eine personalisierte Entwicklung des Verhaltens des Agenten im Laufe der Zeit ermöglichen.
  • Erweiterbare Python-basierte „Fähigkeiten“: Das Framework verwendet eine entkoppelte Fähigkeitserweiterungssystem basierend auf der anthropics/expertise Spezifikation. Entwickler können den Nutzen eines Agenten erweitern, indem sie einfach Python-Funktionen zu einem benutzerdefinierten Ability-Verzeichnis hinzufügen, sodass der Agent bestimmte Aufgaben wie Net Scraping, Dateimanipulation oder API-Integrationen ausführen kann, ohne die Kerncodebasis zu ändern.
  • All-Area-Multi-Channel-Zugriff: CoPaw bietet eine einheitliche Schnittstelle für plattformübergreifende Bereitstellung. Eine einzelne Workstation-Instanz kann mit Unternehmenstools (Lark, DingTalk) und sozialen/Entwicklerplattformen (Discord, QQ, iMessage) verbunden werden, sodass in verschiedenen Umgebungen auf denselben Agenten und seinen Speicher zugegriffen werden kann.
  • Automatisierte Agenten-Workflows: Durch Kombinieren Geplante Aufgaben Mit dem Abilities-System geht CoPaw vom reaktiven Chat zur proaktiven Automatisierung über. Entwickler können „Agentic Apps“ programmieren, die Hintergrundvorgänge ausführen – wie etwa die tägliche Forschungssynthese oder die automatisierte Repository-Überwachung – und Ergebnisse an den bevorzugten Kommunikationskanal des Benutzers weiterleiten.

Schauen Sie sich das an Repo hier Und Webseite. Sie können uns auch gerne weiter folgen Twitter und vergessen Sie nicht, bei uns mitzumachen 120.000+ ML SubReddit und Abonnieren Unser E-newsletter. Warten! Bist du im Telegram? Jetzt können Sie uns auch per Telegram kontaktieren.


Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert