Von Karpathys LLM-Wiki zu Graphify: Aufbau von KI-Speicherebenen

Die meisten KI-Workflows folgen derselben Schleife: Sie laden Dateien hoch, stellen eine Frage, erhalten eine Antwort und dann wird alles zurückgesetzt. Nichts bleibt hängen. Bei großen Codebasen oder Forschungssammlungen wird dies schnell ineffizient. Selbst wenn Sie dasselbe Materials erneut betrachten, liest das Modell es von Grund auf neu, anstatt auf früheren Kontexten oder Erkenntnissen aufzubauen.

Andrej Karpathy hat diese Lücke hervorgehoben und ein LLM-Wiki vorgeschlagen, eine dauerhafte Wissensschicht, die sich mit der Nutzung weiterentwickelt. Die Idee entstand schnell als Graphify. In diesem Artikel untersuchen wir, wie dieser Ansatz KI-Workflows mit langen Kontexten umgestaltet und was er als nächstes freisetzt.

Was ist Graphify?

Das Graphify-System fungiert als KI-Codierungsassistent, der es Benutzern ermöglicht, jedes Verzeichnis in einen durchsuchbaren Wissensgraphen umzuwandeln. Das System fungiert als eigenständige Einheit und nicht nur als Chatbot-System. Das System arbeitet in KI-Codierungsumgebungen, zu denen Claude Code, Cursor, Codex, Gemini-CLI und zusätzliche Plattformen.

Der Installationsprozess erfordert einen einzigen Befehl, der ausgeführt werden muss:

pip set up graphify && graphify set up

Sie müssen Ihren KI-Assistenten starten und den folgenden Befehl eingeben:

/graphify

Sie müssen das System zu einem beliebigen Ordner leiten, bei dem es sich um eine Codebasis, ein Forschungsverzeichnis oder einen Notizen-Dump handeln kann, und dann den Bereich verlassen. Das System generiert einen Wissensgraphen, den Benutzer erkunden können, nachdem sie ihn auf einen beliebigen Ordner gerichtet haben.

Was gebaut wird (und warum es wichtig ist)

Wenn Sie die Ausführung von Graphify abgeschlossen haben, erhalten Sie vier Ausgaben in Ihrem graphify-out/-Ordner:

Der graph.html Die Datei ist eine interaktive, anklickbare Darstellung Ihres Wissensdiagramms, mit der Sie Suchen filtern und Communities finden können
Der GRAPH_REPORT.md Die Datei ist eine Zusammenfassung Ihrer God-Knoten im Klartext, aller unerwarteten Hyperlinks, die Sie möglicherweise entdecken, und einiger vorgeschlagener Fragen, die sich als Ergebnis Ihrer Analyse ergeben.
Die Datei graph.json ist eine dauerhafte Darstellung Ihres Diagramms, die Sie Wochen später abfragen können, ohne die Originaldatenquellen lesen zu müssen, um Ihre Ergebnisse zu generieren.
Das Verzeichnis „cache/“ enthält eine SHA256-basierte Cache-Datei, um sicherzustellen, dass nur Dateien erneut verarbeitet werden, die sich seit der letzten Ausführung von Graphify geändert haben.

All dies wird Teil Ihrer Gedächtnisschicht. Sie werden keine Rohdaten mehr lesen; Stattdessen lesen Sie strukturierte Daten.

Der Token-Effizienz-Benchmark erzählt die wahre Geschichte: Auf einem gemischten Korpus aus Karpathy-Repos, Forschungsarbeiten und Bildern liefert Graphify 71,5-mal weniger Token professional Abfrage im Vergleich zum direkten Lesen von Rohdateien.

Wie es unter der Haube funktioniert?

Der Betrieb von Graphify erfordert zwei unterschiedliche Ausführungsphasen. Der Prozess muss verstanden werden, da sein Funktionsmechanismus von diesem Wissen abhängt:

Das Graphify-System extrahiert die Codestruktur durch Tree-Sitter, der Codedateien analysiert, um ihre Komponenten zu identifizieren. Es umfasst Klassen, Funktionen, Importe, Aufrufdiagramme, Dokumentzeichenfolgen und Begründungskommentare. Das System funktioniert ganz ohne LLM Komponente. Ihr Gerät behält alle Dateiinhalte ohne jegliche Datenübertragung. Das System bietet drei Vorteile: Es erreicht eine hohe Geschwindigkeit, liefert genaue Ergebnisse und schützt die Privatsphäre der Benutzer.

Die Claude-Subagenten führen ihre Aufgaben gleichzeitig in allen Dokumenten aus, darunter PDFs sowie Markdown-Inhalte und Bilder. Sie extrahieren Konzepte, Beziehungen und Designgründe aus unstrukturierten Inhalten. Der Prozess führt zur Erstellung eines einheitlichen NetworkX-Diagramms.

Der Clustering-Prozess verwendet die Leiden-Group-Erkennung, die als fungiert graph-topology-based Methode, die keine Einbettungen oder eine Vektordatenbank erfordert. Die Claude Move 2-Extraktion generiert semantische Ähnlichkeitskanten, die bereits als eingebettete Elemente im Diagramm vorhanden sind und sich direkt auf den Clustering-Prozess auswirken. Die Diagrammstruktur fungiert als Sign, das die Ähnlichkeit zwischen Elementen anzeigt.

Einer der vorteilhaftesten Aspekte von Graphify ist die Methode zur Zuweisung von Konfidenzniveaus. Jede Beziehung wird mit folgendem Tag versehen:

EXTRAHIERT – in der Quelle mit einem Konfidenzniveau von eins gefunden.
GESCHLOSSEN – vernünftige Schlussfolgerung basierend auf einem Grad an Konfidenz (Anzahl).
MEHRDEUTIG – bedarf einer menschlichen Überprüfung.

Dies ermöglicht Ihnen die Unterscheidung zwischen gefundenen und abgeleiteten Daten, was ein Maß an Transparenz bietet, das in den meisten KI-Instruments nicht zu finden ist, und Ihnen dabei hilft, die beste Architektur basierend auf der Diagrammausgabe zu entwickeln.

Was können Sie eigentlich abfragen?

Der Prozess der Abfrage des Methods wird intuitiver, nachdem die Diagrammerstellung abgeschlossen ist. Benutzer können Befehle über ihr Terminal oder ihren KI-Assistenten ausführen:

graphify question "what connects consideration to the optimizer?
graphify question "present the auth movement" --dfs
graphify path "DigestAuth" "Response"
graphify clarify "SwinTransformer"

Das System erfordert, dass Benutzer Suchen anhand bestimmter Begriffe durchführen. Graphify verfolgt die tatsächlichen Verbindungen im Diagramm durch jeden Verbindungspunkt und zeigt gleichzeitig die Verbindungstypen, Konfidenzniveaus und Quellpunkte an. Der --budget Mit dem Flag können Sie die Ausgabe auf eine bestimmte Token-Menge begrenzen. Dies ist wichtig, wenn Sie Untergraphendaten an Ihre nächste Eingabeaufforderung übertragen müssen.

Der richtige Arbeitsablauf läuft nach diesen Schritten ab:

Beginnen Sie mit dem Dokument GRAPH_REPORT.md die wesentliche Informationen zu den Hauptthemen liefert
Verwenden Sie graphify question, um einen fokussierten Untergraphen für Ihre spezifische Frage abzurufen
Sie sollten die kompakte Ausgabe an Ihren KI-Assistenten senden, anstatt die vollständige Datei zu verwenden

Das System erfordert, dass Sie durch das Diagramm navigieren, anstatt seinen gesamten Inhalt in einer einzigen Eingabeaufforderung darzustellen.

All the time-On-Modus: Machen Sie Ihre KI standardmäßig intelligenter

Mit graphify können Änderungen auf Systemebene an Ihrem KI-Assistenten vorgenommen werden. Nachdem Sie ein Diagramm erstellt haben, können Sie Folgendes in einem Terminal ausführen:

graphify claude set up

Dadurch entsteht ein CLAUDE.md Datei im Claude-Code-Verzeichnis, die Claude anweist, die zu verwenden GRAPH_REPORT.md Datei, bevor Sie zur Architektur antworten. Außerdem fügt es einen PreToolUse-Hook in Ihr ein Settings.json Datei, die vor jedem Glob- und Grep-Aufruf ausgelöst wird. Wenn ein Wissensdiagramm vorhanden ist, sollte Claude die Aufforderung sehen, über die Diagrammstruktur zu navigieren, anstatt nach einzelnen Dateien zu suchen.

Diese Änderung hat zur Folge, dass Ihr Assistent keine Dateien mehr nach dem Zufallsprinzip scannt und die Struktur der Daten zum Navigieren verwendet. Dadurch sollten Sie schnellere Antworten auf alltägliche Fragen und bessere Antworten auf komplexere Fragen erhalten.

Unterstützung für Dateitypen

Aufgrund seiner multimodalen Fähigkeiten ist Graphify ein wertvolles Werkzeug für Forschung und Datenerfassung. Graphify unterstützt:

Baumverarbeitung von 20 Programmiersprachen: Python, JavaScript, TypeScript, Go, Rust, Java, C, C++, Ruby, C#, Kotlin, Scala, PHP, Swift, Lua, Zig, PowerShell, Elixir, Goal C und Julia
Quotation Mining und Konzepte aus PDF-Dokumenten
Verarbeiten Sie Bilder (PNG, JPG, WebP, GIF) mit Claude Imaginative and prescient. Diagramme, Screenshots, Whiteboards und Materialien, die nicht auf Englisch basieren.
Extrahieren Sie vollständige Beziehungen und Konzepte aus Markdown, .txt, .rst
Verarbeiten Sie Microsoft Workplace-Dokumente (.docx und .xlsx), indem Sie eine optionale Abhängigkeit einrichten:

pip set up graphifyy(workplace)

Legen Sie einfach einen Ordner mit gemischten Dateitypen in Graphify ab und jede Datei wird entsprechend der entsprechenden Verarbeitungsmethode verarbeitet.

Weitere wissenswerte Funktionen

Graphify umfasst zusätzlich zu seiner Hauptfunktionalität zur Erstellung von Diagrammen aus Codedateien mehrere Funktionen für den Einsatz in einer Produktionsumgebung.

Automatische Synchronisierung mit –watch: Wenn Sie Graphify in einem Terminal ausführen, kann das Diagramm automatisch neu erstellt werden, wenn Codedateien bearbeitet werden. Wenn Sie eine Codedatei bearbeiten, wird automatisch ein Summary Syntax Tree (AST) neu erstellt, um Ihre Änderung widerzuspiegeln. Wenn Sie ein Dokument oder Bild bearbeiten, werden Sie aufgefordert, –replace auszuführen, damit ein LLM das Diagramm erneut durchlaufen kann, um alle Änderungen widerzuspiegeln.
Git-Hooks: Sie können einen Git-Commit erstellen, um das Diagramm jedes Mal neu zu erstellen, wenn Sie den Zweig wechseln, oder einen Commit durchführen, indem Sie graphify Hook Set up ausführen. Sie müssen keinen Hintergrundprozess ausführen, um Graphify auszuführen.
Wiki-Export mit –wiki: Sie können einen Markdown im Wiki-Stil mit einem index.md-Einstiegspunkt für jeden God-Knoten und nach Group innerhalb der Graphify-Datenbank exportieren. Jeder Agent kann die Datenbank durchsuchen, indem er die exportierten Dateien liest.
MCP-Server: Sie können einen MCP-Server auf Ihrem lokalen Pc starten und Ihren Assistenten für wiederholte Abfragen auf strukturierte Diagrammdaten verweisen lassen (query_graph, get_node, get_neighbors, shortest_path) durch Laufen python -m graphify.serve graphify-out/graph.json.
Exportoptionen: Sie können von Graphify nach SVG, GraphML (für Gephi oder yEd) und Cypher (für Neo4j) exportieren.

Abschluss

Dank der Speicherschicht Ihres KI-Assistenten kann er Ideen für zukünftige Sitzungen festhalten. Derzeit ist die gesamte KI-Codierung zustandslos, d. h. jedes Mal, wenn Sie Ihren Assistenten ausführen, beginnt er von vorne. Jedes Mal, wenn Sie dieselbe Frage stellen, werden dieselben Dateien wie zuvor gelesen. Das bedeutet, dass Sie jedes Mal, wenn Sie eine Frage stellen, auch Token verwenden, um Ihren vorherigen Kontext an das System zu senden.

Graphify bietet Ihnen eine Möglichkeit, aus diesem Kreislauf auszubrechen. Anstatt Ihr Diagramm ständig neu erstellen zu müssen, können Sie einfach den SHA256-Cache verwenden, um nur das neu zu generieren, was sich in Ihrer letzten Sitzung geändert hat. Ihre Abfragen verwenden jetzt eine kompakte Darstellung der Struktur, anstatt aus der unkompilierten Quelle zu lesen.

Mit dem GRAPH_REPORT.mdIhr Assistent verfügt über eine Karte des gesamten Diagramms und der /graphify Befehle ermöglichen es Ihrem Assistenten, sich durch dieses Diagramm zu bewegen. Wenn Sie Ihren Assistenten auf diese Weise einsetzen, wird sich die Artwork und Weise, wie Sie Ihre Arbeit erledigen, völlig verändern.

Häufig gestellte Fragen

Q1. Welches Drawback löst Graphify?

A. Es verhindert wiederholte Dateien, indem es einen dauerhaften, strukturierten Wissensgraphen erstellt.

Q2. Wie funktioniert Graphify?

A. Es kombiniert AST-Extraktion mit paralleler KI-basierter Konzeptextraktion, um ein einheitliches Diagramm zu erstellen.

Q3. Warum ist Graphify effizienter?

A. Es verwendet strukturierte Diagrammdaten und reduziert so den Token-Verbrauch im Vergleich zur wiederholten Verarbeitung von Rohdateien.

Knowledge Science Trainee bei Analytics Vidhya
Derzeit arbeite ich als Knowledge Science Trainee bei Analytics Vidhya, wo ich mich auf die Entwicklung datengesteuerter Lösungen und die Anwendung von KI/ML-Techniken zur Lösung realer Geschäftsprobleme konzentriere. Meine Arbeit ermöglicht es mir, fortschrittliche Analysen, maschinelles Lernen und KI-Anwendungen zu erforschen, die es Unternehmen ermöglichen, intelligentere, evidenzbasierte Entscheidungen zu treffen.
Mit einem starken Fundament in den Bereichen Informatik, Softwareentwicklung und Datenanalyse ist es mir eine Leidenschaft, KI zu nutzen, um wirkungsvolle, skalierbare Lösungen zu schaffen, die die Lücke zwischen Technologie und Geschäft schließen.
📩 Du kannst mich auch erreichen unter (e mail protected)

Von Karpathys LLM-Wiki zu Graphify: Aufbau von KI-Speicherebenen

Was ist Graphify?

Was gebaut wird (und warum es wichtig ist)

Wie es unter der Haube funktioniert?

Was können Sie eigentlich abfragen?

All the time-On-Modus: Machen Sie Ihre KI standardmäßig intelligenter

Unterstützung für Dateitypen

Weitere wissenswerte Funktionen

Abschluss

Häufig gestellte Fragen

Melden Sie sich an, um weiterzulesen und von Experten kuratierte Inhalte zu genießen.

Von admin

Schreibe einen Kommentar Antworten abbrechen

Versäumt

Von Karpathys LLM-Wiki zu Graphify: Aufbau von KI-Speicherebenen

Die versteckten Sicherheitsrisiken, die in Container-Photos lauern

5 Docker-Container für kleine Unternehmen

Hier ist eine Geschichte aus Australien: Es gab so viele Probleme mit der Umfrage, dass die Regierung die Daten nicht veröffentlichte.

About

Categories

Tags

Recent Post

Von Karpathys LLM-Wiki zu Graphify: Aufbau von KI-Speicherebenen

Die versteckten Sicherheitsrisiken, die in Container-Photos lauern

Was ist Graphify?

Was gebaut wird (und warum es wichtig ist)

Wie es unter der Haube funktioniert?

Was können Sie eigentlich abfragen?

All the time-On-Modus: Machen Sie Ihre KI standardmäßig intelligenter

Unterstützung für Dateitypen

Weitere wissenswerte Funktionen

Abschluss

Häufig gestellte Fragen

Melden Sie sich an, um weiterzulesen und von Experten kuratierte Inhalte zu genießen.

Von admin

Ähnlicher Beitrag

Schreibe einen Kommentar Antworten abbrechen

Versäumt