Modelle, die in der Lage sind, eine Vielzahl von Aufgaben wie Recherche und Codierung zu automatisieren. Oftmals arbeitet man jedoch mit einem LLM, erledigt eine Aufgabe und fängt bei der nächsten Interaktion mit dem LLM wieder ganz von vorne an.

Dies ist ein großes Drawback bei der Arbeit mit LLMs. Wir verschwenden viel Zeit damit, Anweisungen an LLMs einfach zu wiederholen, etwa zur gewünschten Codeformatierung oder zur Ausführung von Aufgaben nach Ihren Wünschen.

Hier ist agenten.md Dateien kommen herein: Eine Möglichkeit, kontinuierliches Lernen auf LLMs anzuwenden, wobei das LLM Ihre Muster und Verhaltensweisen lernt, indem es verallgemeinerbare Informationen in einer separaten Datei speichert. Diese Datei wird dann jedes Mal gelesen, wenn Sie eine neue Aufgabe starten, wodurch das Drawback des Kaltstarts vermieden wird und Sie die Wiederholung von Anweisungen vermeiden können.

In diesem Artikel gebe ich einen allgemeinen Überblick darüber, wie ich mit LLMs durch kontinuierliche Aktualisierung kontinuierliches Lernen erreiche agenten.md Datei.

Erfahren Sie, wie Sie kontinuierliches Lernen für LLMs nutzen können
In diesem Artikel erfahren Sie, wie Sie kontinuierliches Lernen auf LLMs anwenden können. Bild von Gemini.

Warum brauchen wir kontinuierliches Lernen?

Es braucht Zeit, mit einem neuen Agentenkontext zu beginnen. Der Agent muss Ihre Präferenzen berücksichtigen, und Sie müssen mehr Zeit mit der Interaktion mit dem Agenten verbringen, damit er genau das tut, was Sie wollen.

Zum Beispiel:

  • Weisen Sie den Agenten an, die Python 3.13-Syntax anstelle von 3.12 zu verwenden
  • Den Agenten darüber informieren, bei Funktionen immer Rückgabetypen zu verwenden
  • Sicherstellen, dass der Agent das niemals verwendet Beliebig Typ

Ich musste den Agenten oft explizit anweisen, die Python 3.13-Syntax und nicht die 3.12-Syntax zu verwenden, wahrscheinlich weil die 3.12-Syntax in ihrem Trainingsdatensatz häufiger vorkommt.

Der Sinn und Zweck des Einsatzes von KI-Agenten besteht darin, schnell zu sein. Daher möchten Sie keine Zeit damit verschwenden, Anweisungen zu wiederholen, welche Python-Model verwendet werden soll oder dass der Agent niemals den Typ „Any“ verwenden sollte.

Darüber hinaus verbringt der KI-Agent manchmal zusätzliche Zeit damit, Informationen herauszufinden, die Ihnen bereits zur Verfügung stehen, zum Beispiel:

  • Der Title Ihrer Dokumententabelle
  • Die Namen Ihrer CloudWatch-Protokolle
  • Die Präfixe in Ihren S3-Buckets

Wenn der Agent den Namen Ihrer Dokumententabelle nicht kennt, muss er Folgendes tun:

  1. Pay attention Sie alle Tabellen auf
  2. Suchen Sie eine Tabelle, die wie die Dokumententabelle klingt (es könnten mehrere mögliche Optionen sein)
  3. Schauen Sie zur Bestätigung entweder in der Tabelle nach oder fragen Sie den Benutzer
Agentisches Gedächtnis
Dieses Bild stellt dar, was ein Agent tun muss, um den Namen Ihrer Dokumententabelle zu finden. Zuerst muss es alle Tabellen in der Datenbank auflisten und dann relevante Tabellennamen finden. Abschließend muss der Agent bestätigen, dass er über die richtige Tabelle verfügt, indem er entweder den Benutzer um Bestätigung bittet oder eine Suche in der Tabelle durchführt. Das nimmt viel Zeit in Anspruch. Stattdessen können Sie den Namen der Dokumenttabelle in Brokers.md speichern und so bei zukünftigen Interaktionen weitaus effektiver mit Ihrem Codierungsagenten arbeiten. Bild von Gemini.

Dies nimmt viel Zeit in Anspruch und kann leicht verhindert werden, indem wir den Namen der Dokumenttabelle, CloudWatch-Protokolle und S3-Bucket-Präfixe hinzufügen agenten.md.

Daher ist der Hauptgrund, warum wir kontinuierliches Lernen benötigen, der, dass das Wiederholen von Anweisungen frustrierend und zeitaufwändig ist und wir bei der Arbeit mit KI-Agenten so effektiv wie möglich sein wollen.

Wie man kontinuierliches Lernen anwendet

Es gibt zwei Hauptmethoden, mit denen ich das kontinuierliche Lernen angehen kann, wobei beide eine intensive Nutzung des erfordern agenten.md Datei, die Sie in jedem Repository haben sollten, an dem Sie arbeiten:

  1. Immer wenn der Agent einen Fehler macht, teile ich ihm mit, wie er den Fehler korrigieren kann, und merke mir dies für später agent.md Datei
  2. Nach jedem Thread, den ich mit dem Agenten hatte, verwende ich die folgende Eingabeaufforderung. Dadurch wird sichergestellt, dass alles, was ich dem Agenten im Verlauf des Threads gesagt habe, oder Informationen, die er im Verlauf des Threads entdeckt hat, für die spätere Verwendung gespeichert wird. Dies macht spätere Interaktionen weitaus effektiver.
Generalize the data from this thread, and keep in mind it for later. 
Something that might be helpful to know for a later interplay, 
when doing comparable issues. Retailer in brokers.md

Die Anwendung dieser beiden einfachen Konzepte wird Sie zu 80 % auf dem Weg zum kontinuierlichen Lernen mit LLMs bringen und Sie zu einem weitaus effektiveren Ingenieur machen.


Der wichtigste Punkt ist, das Agentengedächtnis immer beizubehalten agenten.md im Hinterkopf. Wenn der Agent etwas tut, das Ihnen nicht gefällt, müssen Sie immer daran denken, es aufzubewahren agenten.md

Sie denken vielleicht, Sie riskieren ein Aufblähen agenten.md Dadurch wird der Agent langsamer und teurer. Dies ist jedoch nicht wirklich der Fall. LLMs sind äußerst intestine darin, Informationen in einer Datei zusammenzufassen. Darüber hinaus, auch wenn Sie eine haben agenten.md Wenn eine Datei aus Tausenden von Wörtern besteht, ist das kein wirkliches Drawback, weder im Hinblick auf die Kontextlänge noch auf die Kosten.

Die Kontextlänge von Frontier-LLMs beträgt Hunderttausende Token, das ist additionally überhaupt kein Drawback. Und was die Kosten angeht, werden Sie wahrscheinlich die Kosten für die Nutzung des LLM erkennen gehen. Der Grund dafür ist, dass der Agent weniger Token für die Ermittlung von Informationen aufwendet, da diese Informationen bereits vorhanden sind agenten.md.

Starker Gebrauch von agenten.md für den Agentenspeicher wird sowohl die LLM-Nutzung beschleunigen als auch die Kosten senken

Einige zusätzliche Tipps

Ich möchte auch einige zusätzliche Tipps hinzufügen, die beim Umgang mit dem Agentengedächtnis nützlich sind.

Der erste Tipp ist, dass Sie bei der Interaktion mit Claude Code mit „#“ auf den Speicher des Agenten zugreifen und dann schreiben können, was Sie sich merken möchten. Schreiben Sie beispielsweise Folgendes in das Terminal, wenn Sie mit Claude Code interagieren:

# At all times use Python 3.13 syntax, keep away from 3.12 syntax

Sie erhalten dann eine Choice, wie Sie im Bild unten sehen. Entweder Sie speichern es im Benutzerspeicher, der die Informationen für alle Ihre Interaktionen mit Claude Code speichert, unabhängig vom Code-Repository. Dies ist nützlich für allgemeine Informationen, z. B. für die ständige Verfügbarkeit eines Rückgabetyps für Funktionen.

Die zweite und dritte Choice besteht darin, es in dem aktuellen Ordner, in dem Sie sich befinden, oder im Stammordner Ihres Projekts zu speichern. Dies kann nützlich sein, um entweder ordnerspezifische Informationen zu speichern, die beispielsweise nur einen bestimmten Dienst beschreiben. Oder zum Speichern von Informationen über ein Code-Repository im Allgemeinen.

Claude Code-Speicheroptionen
Dieses Bild verdeutlicht die verschiedenen Erinnerungsmöglichkeiten, die Sie mit Claude haben. Sie können entweder im Benutzerspeicher speichern und so den Speicher über alle Ihre Sitzungen hinweg speichern, unabhängig vom Repository. Darüber hinaus können Sie es in einem Unterordner des Projekts speichern, in dem Sie sich befinden, beispielsweise wenn Sie Informationen zu einem bestimmten Dienst speichern möchten. Schließlich können Sie den Speicher auch im Stammordner des Projekts speichern, sodass alle Arbeiten mit dem Repository über den Kontext verfügen. Bild vom Autor.

Darüber hinaus verwenden unterschiedliche Codierungsagenten unterschiedliche Speicherdateien.

  • Claude Code verwendet CLAUDE.md
  • Warp verwendet WARP.md
  • Cursor verwendet .cursorrules

Normalerweise lesen jedoch alle Agenten agenten.md, Aus diesem Grund empfehle ich, Informationen in dieser Datei zu speichern, damit Sie Zugriff auf den Speicher des Agenten haben, unabhängig davon, welchen Codierungsagenten Sie verwenden. Das liegt daran, dass Claude Code eines Tages der Beste sein wird, aber vielleicht sehen wir an einem anderen Tag einen anderen Coding-Agenten an der Spitze.

AGI und kontinuierliches Lernen

Ich möchte auch eine Anmerkung zu AGI und kontinuierlichem Lernen hinzufügen. Echtes kontinuierliches Lernen wird manchmal als eines der letzten Hindernisse auf dem Weg zur AGI angesehen.

Derzeit täuschen LLMs im Wesentlichen kontinuierliches Lernen vor, indem sie das Gelernte einfach in Dateien speichern, die sie später lesen (z. B. „brokers.md“). Best wäre jedoch, dass LLMs ihre Modellgewichte kontinuierlich aktualisieren, wenn sie neue Informationen lernen, im Wesentlichen so, wie Menschen Instinkte lernen.

Leider ist echtes kontinuierliches Lernen noch nicht erreicht, aber es ist wahrscheinlich eine Fähigkeit, von der wir in den kommenden Jahren mehr sehen werden.

Abschluss

In diesem Artikel habe ich darüber gesprochen, wie Sie ein weitaus effektiverer Ingenieur werden können, indem Sie Brokers.md für kontinuierliches Lernen nutzen. Auf diese Weise erfasst Ihr Agent Ihre Gewohnheiten, die Fehler, die Sie machen, die Informationen, die Sie normalerweise verwenden, und viele andere nützliche Informationen. Dadurch werden spätere Interaktionen mit Ihrem Agenten wiederum wesentlich effektiver. Ich glaube, dass eine starke Nutzung der Datei „brokers.md“ für die Entwicklung eines guten Ingenieurs unerlässlich ist und dass Sie ständig danach streben sollten.

👉 Meine kostenlosen Ressourcen

🚀 Verzehnfachen Sie Ihr Engineering mit LLMs (kostenloser 3-tägiger E-Mail-Kurs)

📚 Holen Sie sich mein kostenloses E-Guide „Imaginative and prescient Language Fashions“.

💻 Mein Webinar zu Imaginative and prescient Language Fashions

👉 Finden Sie mich in den sozialen Netzwerken:

📩 Abonnieren Sie meinen E-newsletter

🧑‍💻 Nehmen Sie Kontakt auf

🔗 LinkedIn

🐦 X / Twitter

✍️ Medium

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert