Tencent Open-Sources TencentDB Agent Reminiscence: Eine 4-stufige lokale Speicherpipeline für KI-Agenten

Tencent hat veröffentlicht TencentDB-Agentenspeicherein Open-Supply-Speichersystem für KI-Agenten. Das Projekt wird unter der MIT-Lizenz ausgeliefert. Es zielt auf ein Drawback ab, das jedem bekannt ist, der Agenten mit langem Horizont ausliefert: Kontextaufblähung und Rückruffehler.

Es handelt sich um ein symbolisches Kurzzeitgedächtnis und ein geschichtetes Langzeitgedächtnis. Es lässt sich als Plugin in OpenClaw und über einen Gateway-Adapter in den Hermes Agent integrieren. Das Commonplace-Backend ist lokales SQLite mit der Erweiterung sqlite-vec, sodass keine externe API erforderlich ist.

Warum das Agentengedächtnis schwierig ist

Die meisten aktuellen Speicherstapel zerkleinern Daten in Fragmente und legen sie in einem flachen Vektorspeicher ab. Der Rückruf wird dann zu einer blinden Ähnlichkeitssuche über unzusammenhängende Fragmente hinweg, ohne Anleitung auf Makroebene. Die Architektur basiert auf zwei Säulen: Erinnerungsschichtung und symbolisches Gedächtnis.

Eine 4-stufige semantische Pyramide

Für eine langfristige Personalisierung erstellt TencentDB Agent Reminiscence eine vierstufige Pyramide anstelle eines flachen Protokolls. Die Ebenen sind L0-Konversation, L1-Atom, L2-Szenario und L3-Persona. Dazu gehören rohe Dialoge, atomare Fakten, Szenenblöcke und ein Benutzerprofil.

Die Persona-Ebene trägt alltägliche Benutzerpräferenzen und wird zuerst abgefragt. Das System führt nur dann einen Drilldown zu Atomen oder Rohkonversationen durch, wenn detailliertere Particulars erforderlich sind. Untere Schichten bewahren Beweise; Die oberen Schichten bewahren die Struktur.

Der Speicher ist heterogen. Fakten, Protokolle und Spuren werden für den Volltextabruf in Datenbanken gespeichert. Personas, Szenen und Canvases werden als für Menschen lesbare Markdown-Dateien gespeichert. Darunter leben geschichtete Erinnerungsartefakte ~/.openclaw/memory-tdai/.

Symbolisches Kurzzeitgedächtnis über Mermaid

Lang laufende Agentenaufgaben verbrauchen Token durch ausführliche Toolprotokolle, Suchergebnisse, Code und Fehlerverfolgungen. TencentDB Agent Reminiscence behebt dieses Drawback durch Kontext-Offloading in Kombination mit symbolischem Speicher.

Vollständige Werkzeugprotokolle werden in externe Dateien unter ausgelagert refs/*.md. Zustandsübergänge werden in der Mermaid-Syntax in einem einfachen Process-Canvas codiert. Der Agent argumentiert über das Symboldiagramm in seinem Kontextfenster.

Wenn der Rohtext benötigt wird, sucht er nach a node_id und ruft die entsprechende Datei ab. Das Tencent-Entwicklerteam beschreibt dies als einen deterministischen Drilldown vom Image der obersten Ebene über den Index der mittleren Ebene bis hin zum Rohtext der unteren Ebene.

Benchmark-Zahlen

Die Ergebnisse werden über kontinuierliche Langstreckensitzungen gemessen, nicht über isolierte Wendungen. SWE-Bench führt beispielsweise 50 aufeinanderfolgende Aufgaben professional Sitzung aus, um den Druck der Kontextakkumulation zu simulieren.

Bei WideSearch erhöht die Integration des Plugins mit OpenClaw die Erfolgsquote von 33 % auf 50 %, was einer relativen Verbesserung von 51,52 % entspricht. Die Token-Nutzung sinkt von 221,31 Mio. auf 85,64 Mio., was einer Reduzierung um 61,38 % entspricht.

Auf der SWE-Benchmark steigt der Erfolg von 58,4 % auf 64,2 %, während die Token von 3474,1 Mio. auf 2375,4 Mio. sinken, was einem Rückgang um 33,09 % entspricht. Bei AA-LCR steigt die Erfolgsquote von 44,0 % auf 47,5 %. Die Anzahl der Token sank von 112,0 Mio. auf 77,3 Mio., was einer Reduzierung um 30,98 % entspricht.

Beim Langzeitgedächtnis steigt die Genauigkeit von PersonaMem von 48 % auf 76 %. Hinweis: Diese Zahlen stammen aus eigenen Auswertungen von Tencent.

Rückruf und Abruf

Beim Abrufen wird standardmäßig eine Hybridstrategie verwendet. Das System kombiniert die BM25-Schlüsselwortsuche mit Vektoreinbettungen, die mithilfe von Reciprocal Rank Fusion (RRF) zusammengeführt werden. Entwickler können auf Pure umsteigen key phrase oder embedding Modus über ein Konfigurationsfeld. Der BM25-Tokenizer unterstützt sowohl Chinesisch (Jieba) als auch Englisch.

Standardeinstellungen lösen alle fünf Runden eine L1-Speicherextraktion aus. Alle 50 neuen Erinnerungen wird eine Benutzerpersona generiert. Recall gibt standardmäßig fünf Elemente mit einem Timeout von 5 Sekunden zurück. Bei einer Zeitüberschreitung überspringt das System die Injektion, anstatt die Konversation zu blockieren.

Installations- und Entwickleroberfläche

Die OpenClaw-Integration wird als einzelnes npm-Paket geliefert: @tencentdb-agent-memory/memory-tencentdb. Das Projekt erfordert Node.js 22.16 oder höher. Für die Aktivierung ist ein Konfigurationsflag erforderlich. Das Plugin übernimmt dann die Konversationserfassung, Speicherextraktion, Szenenaggregation, Persona-Generierung und den Abruf.

Für Hermes bündelt ein Docker-Picture den Agenten, das Plugin und das TDAI Reminiscence Gateway. Das Standardmodell ist DeepSeek-V3.2 von Tencent Cloud. Jeder OpenAI-kompatible Endpunkt funktioniert über das MODEL_PROVIDER=customized Flagge.

Während einer Sitzung werden den Agenten zwei Instruments zur Verfügung gestellt: tdai_memory_search Und tdai_conversation_search. Beide geben Referenzen mit zurück node_id Und result_ref Felder für die Rückverfolgung. Als Different zu lokalem SQLite ist auch ein Tencent Cloud Vector Database (TCVDB)-Backend verfügbar.

Der visuelle Erklärer von Marktechpost

TencentDB-Agentenspeicher – Vorschau

01 / ÜBERSICHT

Was ist TencentDB Agent Reminiscence?

Ein vom MIT lizenziertes Speichersystem für KI-Agenten, das symbolisches Kurzzeitgedächtnis mit einer 4-stufigen Langzeitgedächtnispipeline kombiniert. Läuft vollständig lokal und ohne externe API-Abhängigkeiten.

Kurzzeitgedächtnis

Verlagert ausführliche Software-Protokolle in Dateien und sorgt dafür, dass ein kompakter Mermaid-Aufgabenbereich im Kontext bleibt.

Langzeitgedächtnis

Konversationen werden in eine 4-stufige semantische Pyramide zusammengefasst: L0 → L1 → L2 → L3.

Lokales Backend

Standardmäßig ist SQLite + sqlite-vec. Die Tencent Cloud Vector Database (TCVDB) ist elective.

Integrationen

Wird als OpenClaw-Plugin und als Hermes Agent Docker-Picture geliefert.

02 / ARCHITEKTUR

Die 4-stufige semantische Pyramide

Das Langzeitgedächtnis ist geschichtet und nicht flach. Die oberen Schichten tragen die Struktur; Untere Schichten bewahren Beweise.

L3 · PersonaBenutzerprofil (persona.md)

L2 · SzenarioSzenenblöcke (Markdown)

L1 · AtomAtomare Fakten (JSONL)

L0 · GesprächRoher Dialog

Drilldown-Pfad: Persona → Szenario → Atom → Konversation. Referenzen verwenden node_id Und result_ref für deterministisches Traceback.

03 / SYMBOLISCHE KURZFRISTIGE

Mermaid-Aufgaben-Canvas + Kontext-Offloading

Ausführliche Zwischenprotokolle sind die größten Token-Konsumenten bei langen Aufgaben. Das Plugin lädt sie auf die Festplatte und behält einen Symbolgraphen mit hoher Dichte im Kontext bei.

Wie es funktioniert

Vollständige Werkzeugprotokolle werden nach ausgelagert refs/*.md im Datenverzeichnis.
Zustandsübergänge werden in der Mermaid-Syntax in einem einfachen Process-Canvas codiert.
Der Agent prüft den Symbolgraphen und grapst dann a node_id Rohtext abrufen.

Speicherpfad auf der Festplatte: ~/.openclaw/memory-tdai/. Alle Artefakte sind für das White-Field-Debugging für Menschen lesbar.

04 / INSTALLIEREN

Installieren Sie das OpenClaw-Plugin

Erfordert Node.js 22.16 oder höher und eine OpenClaw-Set up.


openclaw plugins set up @tencentdb-agent-memory/memory-tencentdb
openclaw gateway restart

Zero-Config-Aktivierung

Fügen Sie Folgendes hinzu ~/.openclaw/openclaw.json um es mit Commonplace-SQLite + sqlite-vec zu aktivieren.

{
  "memory-tencentdb": {
    "enabled": true
  }
}

05 / KONFIGURATION

Tägliche Tuning-Parameter

Jedes Feld hat eine sinnvolle Voreinstellung. Die gängigsten Knöpfe sind unten aufgeführt.

Feld	Commonplace	Beschreibung
`storeBackend`	sqlite	Speicher-Backend
`recall.technique`	Hybrid	Schlüsselwort / Einbettung / Hybrid (RRF)
`recall.maxResults`	5	Artikel, die professional Rückruf zurückgegeben wurden
`recall.timeoutMs`	5000	Injektion bei Zeitüberschreitung überspringen
`pipeline.everyNConversations`	5	L1-Extraktion alle N Umdrehungen
`persona.triggerEveryN`	50	Generieren Sie alle N Erinnerungen eine Persona
`offload.enabled`	FALSCH	Kurzzeitkomprimierung umschalten

06 / KURZFRISTIGE KOMPRESSION

Mermaid-Offloading aktivieren (v0.3.4+)

Drei Schritte zum Aktivieren der Kontextauslagerung für Langzeitaufgaben.

Schritt 1 · Offload in der Plugin-Konfiguration aktivieren

{
  "memory-tencentdb": {
    "config": {
      "offload": { "enabled": true }
    }
  }
}

Schritt 2 · Registrieren Sie den Slot, damit OpenClaw Offload-Anfragen weiterleitet

{
  "plugins": {
    "slots": {
      "contextEngine": "openclaw-context-offload"
    }
  }
}

Schritt 3 · Wenden Sie den Laufzeit-Patch an (einmal professional OpenClaw-Set up).

bash scripts/openclaw-after-tool-call-messages.patch.sh

07 / HERMES DOCKER

Führen Sie speicherfähiges Hermes in einem Container aus

Ein einzelnes Docker-Picture bündelt Hermes Agent, das Memory_tencentdb-Plugin und das TDAI Reminiscence Gateway.


docker construct -f Dockerfile.hermes -t hermes-memory .


docker run -d 
  --name hermes-memory 
  --restart unless-stopped 
  -p 8420:8420 
  -e MODEL_API_KEY="your-api-key" 
  -e MODEL_BASE_URL="https://api.lkeap.cloud.tencent.com/v1" 
  -e MODEL_NAME="deepseek-v3.2" 
  -e MODEL_PROVIDER="customized" 
  -v hermes_data:/decide/knowledge 
  hermes-memory


curl http://localhost:8420/well being

Jeder OpenAI-kompatible Endpunkt funktioniert durch MODEL_PROVIDER=customized. Speicherdaten bleiben erhalten hermes_data Volumen.

08 / Agenten-Instruments und Rückruf

Was der Agent sieht

Während einer Sitzung werden dem Agenten zwei Instruments angezeigt. Recall verwendet standardmäßig BM25 + Vektor + RRF-Fusion.

tdai_memory_search

Durchsuchen Sie L1-Atome, L2-Szenarien und L3-Persona.

tdai_conversation_search

Durchsuchen Sie den rohen L0-Gesprächsverlauf.

Standardwerte für den Abruf

Hybridstrategie: BM25-Schlüsselwort + Vektoreinbettung, verschmolzen über Reciprocal Rank Fusion.
Der BM25-Tokenizer unterstützt Chinesisch (Jieba) und Englisch.
Gibt 5 Artikel professional Rückruf zurück; 5000 ms Timeout; Bei Zeitüberschreitung wird die Injektion übersprungen.
Referenzen umfassen node_id Und result_ref zur Rückverfolgung.

09 / BENCHMARKS

Gemeldete Gewinne mit OpenClaw

Gemessen über kontinuierliche Sitzungen über einen längeren Zeitraum hinweg, nicht über isolierte Kurven. SWE-Bench führt 50 aufeinanderfolgende Aufgaben professional Sitzung aus.

Benchmark	Grundlinie	Mit Plugin	Δ Bestanden	Δ Token
WideSearch	33 %	50 %	+51,52 %	−61,38 %
SWE-Financial institution	58,4 %	64,2 %	+9,93 %	−33,09 %
AA-LCR	44,0 %	47,5 %	+7,95 %	−30,98 %
PersonaMem	48 %	76 %	+59 %	—

Die Zahlen stammen aus eigenen Auswertungen von Tencent und spiegeln die Integration mit OpenClaw wider.

10 / RESSOURCEN

Wohin als nächstes?

Dokumentation, Quellcode und Neighborhood-Kanäle.

Quellcode

github.com/Tencent/TencentDB-Agent-Reminiscence

npm-Paket

@tencentdb-agent-memory/memory-tencentdb

Roadmap

Tragbarer Speicher, automatische Ability-Generierung, visuelles Debugging-Dashboard.

Kuratiert von MARKTECHPOST · KI-Forschung, entwickelt für Bauherren

Wichtige Erkenntnisse

TencentDB Agent Reminiscence ist Tencents Open-Supply-Speichersystem (MIT) für KI-Agenten, das auf symbolischem Kurzzeitgedächtnis und einer mehrschichtigen Langzeitspeicher-Pipeline ohne externe API-Abhängigkeiten basiert.
Das Langzeitgedächtnis ist als 4-stufige semantische Pyramide strukturiert (L0-Konversation → L1-Atom → L2-Szenario → L3-Persona) mit Drilldown über node_id Und result_ref statt Flat-Vector-Recall.
Das Kurzzeitgedächtnis lädt ausführliche Werkzeugprotokolle dorthin refs/*.md und behält nur einen kompakten Mermaid-Aufgabenbereich im Kontext bei, wodurch die Token-Nutzung reduziert und gleichzeitig die vollständige Rückverfolgbarkeit gewahrt bleibt.
Gemeldete Gewinne bei Integration mit OpenClaw: WideSearch-Erfolgsquote 33 % → 50 % mit einer Token-Reduzierung von 61,38 %, SWE-Bench 58,4 % → 64,2 %, AA-LCR 44,0 % → 47,5 % und PersonaMem-Genauigkeit 48 % → 76 %.
Wird als einzelnes npm-Plugin für OpenClaw und als Docker-Picture für Hermes geliefert, standardmäßig mit lokalem SQLite + sqlite-vec, hybridem BM25 + Vektor + RRF-Abruf und einem optionalen Tencent Cloud Vector Database (TCVDB)-Backend.

Schauen Sie sich das an Repo. Sie können uns auch gerne weiter folgen Twitter und vergessen Sie nicht, bei uns mitzumachen 150.000+ ML SubReddit und Abonnieren Unser Publication. Warten! Bist du im Telegram? Jetzt können Sie uns auch per Telegram kontaktieren.

Möchten Sie mit uns zusammenarbeiten, um Ihr GitHub-Repo ODER Ihre Hugging Face Web page ODER Produktveröffentlichung ODER Ihr Webinar usw. zu bewerben? Vernetzen Sie sich mit uns

Michal Sutter ist ein Information-Science-Experte mit einem Grasp of Science in Information Science von der Universität Padua. Mit einer soliden Grundlage in statistischer Analyse, maschinellem Lernen und Datentechnik ist Michal hervorragend darin, komplexe Datensätze in umsetzbare Erkenntnisse umzuwandeln.