So bauen Sie eine leistungsstarke LLM-Wissensdatenbank auf

ist ein Konzept, bei dem Sie viele Informationen speichern und sie für die zukünftige Verwendung zugänglich machen. Das ist unglaublich wirkungsvoll für:

Bessere Entscheidungsfindung
Schnelles Aufgreifen vergangener Zusammenhänge
Ausrichtung Ihres Groups

In letzter Zeit habe ich viel damit begonnen, eine Wissensdatenbank einzurichten und so viel Kontext wie möglich hineinzuleiten, um alle oben genannten Punkte zu verbessern. Wissensdatenbanken waren schon vor LLMs immer nützlich, da es immer nützlich ist, auf früheres Wissen zuzugreifen. Allerdings sind die Wissensdatenbanken durch LLMs exponentiell leistungsfähiger geworden.

Dies hat zwei Hauptgründe:

Weitere Informationen können Sie in den Wissensdatenbanken erfassen
Sie können die Wissensdatenbank einfacher abfragen (Sie müssen sie nicht manuell durchsuchen).

In diesem Artikel erkläre ich, warum Sie Ihre eigene LLM-gestützte Wissensdatenbank einrichten sollten, wie Sie so viele Informationen wie möglich erfassen und wie Sie die Wissensdatenbank aktiv nutzen.

Ich habe dieses Thema schon einmal diskutiert, aber das Thema Wissensdatenbanken gefällt mir immer mehr, weil es so beliebt ist. Sie haben zum Beispiel den Präsidenten des Y-Combinator-Gebäudes GBrainoder Andrej Karpathy baut ein LLM-Wiki aufbeides Beispiele für Wissensdatenbanken.

Es gibt natürlich keine fundierte Aussage darüber, wie eine Wissensbasis optimum aufgebaut werden kann. Ich denke, das Wichtigste ist, tatsächlich damit zu beginnen, den gesamten Kontext in einer Wissensdatenbank zu speichern und herauszufinden, wie man die Wissensdatenbank jederzeit effektiv abfragen kann, zum Beispiel beim Schreiben von Code, in Besprechungen oder ähnlichem.

Warum Sie eine Wissensdatenbank haben sollten

Zunächst möchte ich erläutern, warum Sie über eine Wissensdatenbank verfügen sollten. Sie können über unterschiedliche Wissensdatenbanken verfügen. Sie können beispielsweise eine persönliche Wissensdatenbank haben, die aus dem gesamten Kontext besteht, über den Sie persönlich verfügen, oder Sie können eine unternehmensweite Wissensdatenbank haben, die aus Wissen oder Kontexten besteht, über die das Unternehmen verfügt.

Der Grund, warum Sie über eine Wissensdatenbank verfügen sollten, liegt darin, dass Informationen äußerst wertvoll sind. Je mehr Informationen Sie speichern und später bei Bedarf abrufen können, desto besser ist Ihre Leistung. Sie können zum Beispiel:

Treffen Sie bessere Entscheidungen, weil Sie Zugriff auf mehr Kontext haben
Erfassen Sie frühere Themen schneller, ohne verschiedene Quellen durchsuchen zu müssen, um die Informationen zu dem Thema zu finden
Bringen Sie verschiedene Menschen zusammen, weil sie eine einzige Quelle der Wahrheit haben.

Die gleichen Konzepte gelten grundsätzlich sowohl für den Fall, dass Sie über eine persönliche Wissensdatenbank verfügen, als auch für den Fall, dass Sie über eine unternehmensweite Wissensdatenbank verfügen. Ich glaube auch, dass diese Wissensdatenbanken viel leistungsfähiger geworden sind, weil man sie mit LLMs abfragen kann. Bisher mussten Sie die Wissensdatenbank manuell durchsuchen, um relevante Informationen zu finden. Sie müssten Ihr eigenes Gedächtnis nutzen, um sich daran zu erinnern, ob eine bestimmte Info in der Wissensdatenbank gespeichert warfare, und dann entscheiden, ob Sie Zeit damit verbringen möchten, diese Informationen zu finden oder nicht.

Das hat sich nun völlig umgedreht. Das LLM kann die Wissensdatenbank beispielsweise mit einem RAG-Ansatz selbst abfragen und relevante Informationen sofort automatisch finden. Der LLM kann selbst entscheiden, wann er die Wissensbasis nutzen muss.

Das heißt, Sie entfernen vollständig die Ebene, die Human-in-the-Loop-Anforderung für den Zugriff auf Informationen in einer Wissensdatenbank, was diese wesentlich leistungsfähiger macht.

Erfassen von Informationen in der Wissensdatenbank

Der erste Schritt der Wissensdatenbank besteht natürlich darin, Informationen in der Wissensdatenbank zu erfassen. Je nachdem, wie Ihre Wissensbasis aufgebaut ist, kann dies auf unterschiedliche Weise geschehen.

Als Erstes möchte ich Sie jedoch bitten, an all die verschiedenen Informationsquellen zu denken, auf die Sie persönlich oder im Unternehmen Zugriff haben. Dies sind zum Beispiel:

Treffen
Ihr Projektmanagement-Software, z. B. Linear.
Ihr Codierungsagent, z. B. Claude Code oder Codex. Woran haben Sie in letzter Zeit mit diesen Modellen gearbeitet (und welche Aufgaben wurden erledigt)?
Besprechungen im Büro.

Ihnen fallen wahrscheinlich viele verschiedene andere Informationsquellen ein. Das hängt natürlich ein bisschen davon ab, wie man arbeitet und wo man arbeitet. Der Punkt ist, dass Sie all diese verschiedenen Informationsquellen abbilden und einen automatischen Weg finden sollten, Informationen aus diesen Quellen in Ihre Wissensdatenbank weiterzuleiten.

Sie und andere werden nicht bereit sein, mehr Zeit damit zu verbringen, Dinge manuell in Wissensdatenbanken einzupflegen. Sie müssen einen Weg finden, dies automatisch zu tun, um Ihre Wissensdatenbank auf dem neuesten Stand zu halten.

Es ist wichtig, dass Sie die Weiterleitung der Informationen von der Quelle zur Wissensdatenbank vollständig automatisieren. Wenn Sie einen manuellen Schritt benötigen (z. B. das Einfügen von Besprechungsnotizen in die Wissensdatenbank), werden Sie ihn mit Sicherheit vergessen und wichtigen Kontext verlieren, was dem gesamten Konzept der Wissensdatenbank zuwiderläuft. Der Sinn der Wissensdatenbank besteht darin, dass Sie dort absolut alle Informationen speichern und nichts auslassen. Das macht eine Wissensdatenbank so leistungsstark.

Beispielsweise können Sie für Besprechungsnotizen einen Cronjob einrichten, der täglich synchronisiert wird. Es nimmt jede Besprechungsnotiz auf, die jeder im Unternehmen oder Sie persönlich hatte, und speichert sie in einer Wissensdatenbank. Sie können einen ähnlichen Cron-Job für Ihr Linear- oder Projektmanagement-Software einrichten, um alles zu synchronisieren, was dort passiert ist. Synchronisieren Sie Ihren Codierungsagenten mit dem, woran Sie gearbeitet haben, mit allem, was Sie mit Ihrem Codierungsagenten besprochen haben usw. All dies kann einfach mit einem täglichen Cronjob in die Wissensdatenbank synchronisiert werden.

Besprechungen im Büro sind ein Punkt, der sich schwerer vollständig automatisieren lässt. Ich habe das selbst noch nicht ganz herausgefunden, aber zwei Möglichkeiten wären:

ständig alles aufzuzeichnen, was vor sich geht, wofür natürlich eine Einwilligung erforderlich wäre
oder einfach manuell Dinge aufschreiben, nachdem man im Büro eine Diskussion geführt hat

Ich denke jedoch, dass Sie die Bürodiskussionen möglicherweise nicht einmal explizit speichern müssen, da in den meisten Fällen, nachdem ich eine Diskussion physisch im Büro geführt habe, die Particular person, mit der ich die Diskussion geführt habe, oder ich den Kontext aus dieser Diskussion nehmen und ihn in ihren Codierungsagenten schreiben. Diese Diskussion wurde normalerweise aufgrund einer Frage zu einer Implementierung geführt. Wenn dieses Wissen additionally anschließend aktiv in Ihrem Codierungsagenten verwendet wird, können Sie es aus den Protokollen des Codierungsagenten abrufen.

Wenn Sie diesen Schritt additionally erfolgreich abgeschlossen und den gesamten Kontext, auf den Sie täglich stoßen, in Ihrer Wissensdatenbank gespeichert haben, haben Sie den größten Teil der Arbeit erledigt. Das ist der schwierige Teil der Wissensdatenbank. Im nächsten Abschnitt werde ich den einfacheren Teil behandeln, bei dem die Informationen aus der Wissensdatenbank aktiv genutzt werden, wenn Entscheidungen getroffen werden oder mit Ihren Programmieragenten interagiert wird.

Nutzung von Informationen aus der Wissensdatenbank

Wenn Sie über eine synchronisierte Wissensdatenbank mit allen benötigten Informationen verfügen, können Sie diese Informationen nun aktiv nutzen. Ich denke, es gibt zwei Hauptansätze zur Nutzung der Informationen aus einer Wissensdatenbank:

Wenn Sie eine Frage haben, können Sie einfach die Wissensdatenbank abfragen. Dies sollte natürlich über Ihren Codierungsagenten erfolgen. Sie stellen ihm eine Frage und er sollte wissen, dass er die Wissensdatenbank abfragen muss, um die Antwort zu finden.
Die zweite besteht darin, dass der Codierungsagent die Wissensdatenbank passiv nutzt, wann immer sie funktioniert.

Ich denke, die erste Anwendung hier ist ziemlich selbsterklärend. Stellen Sie die Frage einfach immer dann, wenn Sie sich bei etwas nicht sicher sind. Deshalb werde ich hier mehr Zeit auf die Diskussion des zweiten Punktes verwenden.

Wenn der Codierungsagent die Wissensdatenbank bei jeder Arbeit passiv nutzt, beispielsweise um eine Codeimplementierung durchzuführen, einen Fehler zu beheben usw. Das ist sehr leistungsstark. Auch hier denke ich, dass es hierfür zwei Hauptansätze gibt.

Grep-basierte Schlussfolgerung

Eine besteht darin, eine Markdown-Datei auf oberster Ebene in der Wissensdatenbank zu haben, die die gesamte Wissensdatenbank erklärt und erklärt, wo sich die verschiedenen Informationen befinden. Diese Datei wird natürlich immer dann aktualisiert, wenn Sie der Wissensdatenbank weitere Informationen hinzufügen.

Der Vorteil dieses Ansatzes besteht darin, dass Sie grep verwenden, das normalerweise leistungsfähiger ist als die einbettungsbasierte Suche, da es bei Bedarf besser die richtigen Informationen finden kann. Dies erfordert jedoch auch, dass Sie diese Markdown-Datei in den Kontext des LLM einfügen, das Sie ständig verwenden. Diese Markdown-Datei kann sehr groß werden, was nach einiger Zeit zu einem Downside werden kann.

Einbettungsbasierte Inferenz

Die zweite Möglichkeit, die Wissensdatenbank aktiv zu nutzen, besteht in einer einbettungsbasierten Inferenz. Dafür ist GBrain gemacht. Wenn Sie eine Abfrage ausführen, führen Sie grundsätzlich eine eingebettete Suche durch, etwa eine RAG in der Wissensdatenbank, und diese ruft einige relevante Abschnitte aus der Wissensdatenbank ab. Wenn der LLM denkt, dass er mithilfe der Einbettungssuche relevante Informationen abgerufen hat, kann er die relevanten Dateien weiter untersuchen.

Ich denke, dass dies wahrscheinlich der bessere Ansatz für die Verwendung der Wissensdatenbank während der Inferenz ist, da keine aktive Suche erforderlich ist und nicht für alles, was Sie tun, viele Eingabetokens für die Wissensdatenbank ausgegeben werden müssen.

Welcher Ansatz am besten funktioniert, hängt jedoch definitiv von Ihren Anwendungsfällen ab.

Abschluss

Alles in allem fordere ich Sie auf:

Versuchen Sie, eine Wissensdatenbank einzurichten
Schreiben Sie so viele Informationen wie möglich hinein
Lesen Sie, wie andere diese Wissensdatenbanken eingerichtet haben
Versuchen Sie es selbst einzurichten

Dann sollten Sie diese Wissensdatenbank immer dann aktiv nutzen, wenn Sie mit einem Codierungsagenten an Ihrem Pc arbeiten (was grundsätzlich für alle Arbeiten gelten sollte, die Sie durchführen). Ich glaube, dass Wissensdatenbanken in den kommenden Jahren unglaublich leistungsfähig und wertvoll sein werden, und sie können Ihnen auch einen Vorsprung verschaffen, da der Zugriff auf viele Informationen in Zukunft ein klarer Vorteil sein wird. Darüber hinaus handelt es sich hierbei um spezifische Daten zu Ihrem Unternehmen oder Ihrem persönlichen Kontext, auf die in vielen Fällen nur Sie Zugriff haben. Wenn Sie sie additionally nicht speichern, können Sie in Zukunft nie wieder auf diese Informationen zugreifen.

👋 Nehmen Sie Kontakt auf

👉 Mein kostenloses E-E-book und Webinar:

🚀 Verzehnfachen Sie Ihr Engineering mit LLMs (kostenloser 3-tägiger E-Mail-Kurs)

📚 Holen Sie sich mein kostenloses E-E-book „Imaginative and prescient Language Fashions“.

💻 Mein Webinar zu Imaginative and prescient Language Fashions

👉 Finden Sie mich in den sozialen Netzwerken:

💌 Unterstapel

🔗 LinkedIn

🐦 X / Twitter

So bauen Sie eine leistungsstarke LLM-Wissensdatenbank auf

Warum Sie eine Wissensdatenbank haben sollten

Erfassen von Informationen in der Wissensdatenbank

Nutzung von Informationen aus der Wissensdatenbank

Grep-basierte Schlussfolgerung

Einbettungsbasierte Inferenz

Abschluss

Von admin

Schreibe einen Kommentar Antworten abbrechen

Versäumt

So bauen Sie eine leistungsstarke LLM-Wissensdatenbank auf

Apple verzichtet auf M6 Professional- und Max-Chips und bringt M7 im Jahr 2027 auf den Markt

Ergänzen Sie diese alphabetische Anzeige durch ein weiteres Diagramm, das die Bundesstaaten in einer informativeren Reihenfolge zeigt.

5 Open-Supply-Omni-KI-Modelle, die Textual content, Bilder, Audio und Video verarbeiten

About

Categories

Tags

Recent Post

So bauen Sie eine leistungsstarke LLM-Wissensdatenbank auf

Apple verzichtet auf M6 Professional- und Max-Chips und bringt M7 im Jahr 2027 auf den Markt

Warum Sie eine Wissensdatenbank haben sollten

Erfassen von Informationen in der Wissensdatenbank

Nutzung von Informationen aus der Wissensdatenbank

Grep-basierte Schlussfolgerung

Einbettungsbasierte Inferenz

Abschluss

Von admin

Ähnlicher Beitrag

Schreibe einen Kommentar Antworten abbrechen

Versäumt