Tencent hat veröffentlicht TencentDB-Agentenspeicherein Open-Supply-Speichersystem für KI-Agenten. Das Projekt wird unter der MIT-Lizenz ausgeliefert. Es zielt auf ein Drawback ab, das jedem bekannt ist, der Agenten mit langem Horizont ausliefert: Kontextaufblähung und Rückruffehler.
Es handelt sich um ein symbolisches Kurzzeitgedächtnis und ein geschichtetes Langzeitgedächtnis. Es lässt sich als Plugin in OpenClaw und über einen Gateway-Adapter in den Hermes Agent integrieren. Das Commonplace-Backend ist lokales SQLite mit der Erweiterung sqlite-vec, sodass keine externe API erforderlich ist.
Warum das Agentengedächtnis schwierig ist
Die meisten aktuellen Speicherstapel zerkleinern Daten in Fragmente und legen sie in einem flachen Vektorspeicher ab. Der Rückruf wird dann zu einer blinden Ähnlichkeitssuche über unzusammenhängende Fragmente hinweg, ohne Anleitung auf Makroebene. Die Architektur basiert auf zwei Säulen: Erinnerungsschichtung und symbolisches Gedächtnis.
Eine 4-stufige semantische Pyramide
Für eine langfristige Personalisierung erstellt TencentDB Agent Reminiscence eine vierstufige Pyramide anstelle eines flachen Protokolls. Die Ebenen sind L0-Konversation, L1-Atom, L2-Szenario und L3-Persona. Dazu gehören rohe Dialoge, atomare Fakten, Szenenblöcke und ein Benutzerprofil.
Die Persona-Ebene trägt alltägliche Benutzerpräferenzen und wird zuerst abgefragt. Das System führt nur dann einen Drilldown zu Atomen oder Rohkonversationen durch, wenn detailliertere Particulars erforderlich sind. Untere Schichten bewahren Beweise; Die oberen Schichten bewahren die Struktur.
Der Speicher ist heterogen. Fakten, Protokolle und Spuren werden für den Volltextabruf in Datenbanken gespeichert. Personas, Szenen und Canvases werden als für Menschen lesbare Markdown-Dateien gespeichert. Darunter leben geschichtete Erinnerungsartefakte ~/.openclaw/memory-tdai/.
Symbolisches Kurzzeitgedächtnis über Mermaid
Lang laufende Agentenaufgaben verbrauchen Token durch ausführliche Toolprotokolle, Suchergebnisse, Code und Fehlerverfolgungen. TencentDB Agent Reminiscence behebt dieses Drawback durch Kontext-Offloading in Kombination mit symbolischem Speicher.
Vollständige Werkzeugprotokolle werden in externe Dateien unter ausgelagert refs/*.md. Zustandsübergänge werden in der Mermaid-Syntax in einem einfachen Process-Canvas codiert. Der Agent argumentiert über das Symboldiagramm in seinem Kontextfenster.
Wenn der Rohtext benötigt wird, sucht er nach a node_id und ruft die entsprechende Datei ab. Das Tencent-Entwicklerteam beschreibt dies als einen deterministischen Drilldown vom Image der obersten Ebene über den Index der mittleren Ebene bis hin zum Rohtext der unteren Ebene.
Benchmark-Zahlen
Die Ergebnisse werden über kontinuierliche Langstreckensitzungen gemessen, nicht über isolierte Wendungen. SWE-Bench führt beispielsweise 50 aufeinanderfolgende Aufgaben professional Sitzung aus, um den Druck der Kontextakkumulation zu simulieren.
Bei WideSearch erhöht die Integration des Plugins mit OpenClaw die Erfolgsquote von 33 % auf 50 %, was einer relativen Verbesserung von 51,52 % entspricht. Die Token-Nutzung sinkt von 221,31 Mio. auf 85,64 Mio., was einer Reduzierung um 61,38 % entspricht.
Auf der SWE-Benchmark steigt der Erfolg von 58,4 % auf 64,2 %, während die Token von 3474,1 Mio. auf 2375,4 Mio. sinken, was einem Rückgang um 33,09 % entspricht. Bei AA-LCR steigt die Erfolgsquote von 44,0 % auf 47,5 %. Die Anzahl der Token sank von 112,0 Mio. auf 77,3 Mio., was einer Reduzierung um 30,98 % entspricht.
Beim Langzeitgedächtnis steigt die Genauigkeit von PersonaMem von 48 % auf 76 %. Hinweis: Diese Zahlen stammen aus eigenen Auswertungen von Tencent.
Rückruf und Abruf
Beim Abrufen wird standardmäßig eine Hybridstrategie verwendet. Das System kombiniert die BM25-Schlüsselwortsuche mit Vektoreinbettungen, die mithilfe von Reciprocal Rank Fusion (RRF) zusammengeführt werden. Entwickler können auf Pure umsteigen key phrase oder embedding Modus über ein Konfigurationsfeld. Der BM25-Tokenizer unterstützt sowohl Chinesisch (Jieba) als auch Englisch.
Standardeinstellungen lösen alle fünf Runden eine L1-Speicherextraktion aus. Alle 50 neuen Erinnerungen wird eine Benutzerpersona generiert. Recall gibt standardmäßig fünf Elemente mit einem Timeout von 5 Sekunden zurück. Bei einer Zeitüberschreitung überspringt das System die Injektion, anstatt die Konversation zu blockieren.
Installations- und Entwickleroberfläche
Die OpenClaw-Integration wird als einzelnes npm-Paket geliefert: @tencentdb-agent-memory/memory-tencentdb. Das Projekt erfordert Node.js 22.16 oder höher. Für die Aktivierung ist ein Konfigurationsflag erforderlich. Das Plugin übernimmt dann die Konversationserfassung, Speicherextraktion, Szenenaggregation, Persona-Generierung und den Abruf.
Für Hermes bündelt ein Docker-Picture den Agenten, das Plugin und das TDAI Reminiscence Gateway. Das Standardmodell ist DeepSeek-V3.2 von Tencent Cloud. Jeder OpenAI-kompatible Endpunkt funktioniert über das MODEL_PROVIDER=customized Flagge.
Während einer Sitzung werden den Agenten zwei Instruments zur Verfügung gestellt: tdai_memory_search Und tdai_conversation_search. Beide geben Referenzen mit zurück node_id Und result_ref Felder für die Rückverfolgung. Als Different zu lokalem SQLite ist auch ein Tencent Cloud Vector Database (TCVDB)-Backend verfügbar.
Der visuelle Erklärer von Marktechpost
Kuratiert von MARKTECHPOST · KI-Forschung, entwickelt für Bauherren
Wichtige Erkenntnisse
- TencentDB Agent Reminiscence ist Tencents Open-Supply-Speichersystem (MIT) für KI-Agenten, das auf symbolischem Kurzzeitgedächtnis und einer mehrschichtigen Langzeitspeicher-Pipeline ohne externe API-Abhängigkeiten basiert.
- Das Langzeitgedächtnis ist als 4-stufige semantische Pyramide strukturiert (L0-Konversation → L1-Atom → L2-Szenario → L3-Persona) mit Drilldown über
node_idUndresult_refstatt Flat-Vector-Recall. - Das Kurzzeitgedächtnis lädt ausführliche Werkzeugprotokolle dorthin
refs/*.mdund behält nur einen kompakten Mermaid-Aufgabenbereich im Kontext bei, wodurch die Token-Nutzung reduziert und gleichzeitig die vollständige Rückverfolgbarkeit gewahrt bleibt. - Gemeldete Gewinne bei Integration mit OpenClaw: WideSearch-Erfolgsquote 33 % → 50 % mit einer Token-Reduzierung von 61,38 %, SWE-Bench 58,4 % → 64,2 %, AA-LCR 44,0 % → 47,5 % und PersonaMem-Genauigkeit 48 % → 76 %.
- Wird als einzelnes npm-Plugin für OpenClaw und als Docker-Picture für Hermes geliefert, standardmäßig mit lokalem SQLite + sqlite-vec, hybridem BM25 + Vektor + RRF-Abruf und einem optionalen Tencent Cloud Vector Database (TCVDB)-Backend.
Schauen Sie sich das an Repo. Sie können uns auch gerne weiter folgen Twitter und vergessen Sie nicht, bei uns mitzumachen 150.000+ ML SubReddit und Abonnieren Unser Publication. Warten! Bist du im Telegram? Jetzt können Sie uns auch per Telegram kontaktieren.
Möchten Sie mit uns zusammenarbeiten, um Ihr GitHub-Repo ODER Ihre Hugging Face Web page ODER Produktveröffentlichung ODER Ihr Webinar usw. zu bewerben? Vernetzen Sie sich mit uns
Michal Sutter ist ein Information-Science-Experte mit einem Grasp of Science in Information Science von der Universität Padua. Mit einer soliden Grundlage in statistischer Analyse, maschinellem Lernen und Datentechnik ist Michal hervorragend darin, komplexe Datensätze in umsetzbare Erkenntnisse umzuwandeln.

