
# Einführung
Claude Code ist wirklich nützlich, kann aber auch viel schneller teuer werden, als man denkt. Der Grund ist einfach. Sie zahlen nicht nur für die Eingabeaufforderung, die Sie gerade eingegeben haben. In vielen Fällen trägt Claude auch den Relaxation der Sitzung mit sich, z. B. frühere Nachrichten, bereits gelesene Dateien, Instrument-Ausgaben und Speicherdateien CLAUDE.mdund andere Hintergrundanweisungen. Wenn additionally der Token-Verbrauch ansteigt, liegt das eigentliche Drawback meist nicht in einer schlechten Aufforderung. Es ist ein chaotischer Kontext.
Viele allgemeine Ratschläge zu diesem Thema sind nicht besonders hilfreich. „Halten Sie Gespräche kurz“ ist wahr, aber es sagt Ihnen nicht, was tatsächlich die Nadel bewegt. Was tatsächlich hilft, ist zu verstehen, wie Claude Code Kontext aufbaut, was immer wieder sauer wird und welche Teile Ihres Workflows mit der Zeit stillschweigend zu Verschwendung führen. In diesem Artikel werden wir uns damit befassen 7 praktische Möglichkeiten, die Ihnen helfen, Claude Code effizient zu nutzen ohne ständig über die Kosten nachdenken zu müssen. Additionally, fangen wir an.
# 1. Modellwechsel nach Aufgabenkomplexität
Dieses ist einfach, wird aber stark zu wenig genutzt. Nicht jede Aufgabe erfordert das teuerste Setup. Zur API-Abrechnung: Opus kostet professional Token 5x mehr als Sonnet. Bei Abonnementplänen erschöpfen schwerere Modelle Ihr Kontingentfenster schneller.
/mannequin sonnet # Day-to-day: writing assessments, easy edits,
# explaining code, refactoring
/mannequin opus # Complicated: multi-file structure choices,
# debugging gnarly cross-system points
/mannequin haiku # Fast: lookups, formatting, renaming,
# something repetitive
Starten Sie jede Sitzung auf Sonnet. Wechseln Sie nur dann zu Opus, wenn Sie wirklich eine umfassende Analyse oder komplexe Umgestaltung benötigen. Besuchen Sie Haiku für die mechanischen Sachen. Sie können den Aufwandsgrad auch direkt mit steuern /effort. Bei einfachen Aufgaben reduziert die Reduzierung des Aufwands das Denkbudget, das das Modell zuweist, wodurch direkt Ausgabetoken eingespart werden.
# 2. CLAUDE.md klein und nützlich halten
Eine der besten Möglichkeiten, Token zu speichern, besteht darin, nicht mehr in jedem Chat die gleichen Projektregeln einzugeben. Genau das ist es CLAUDE.md ist für. Es wird geladen, bevor Claude Ihren Code liest, bevor es Ihre Aufgabe liest, vor irgendetwas. Es bleibt während der gesamten Sitzung im Kontextfenster bestehen und wird niemals verzögert geladen oder entfernt. Das bedeutet einen 5.000-Token CLAUDE.md kostet in jeder Runde 5.000 Token, unabhängig davon, ob Sie 2 oder 200 Nachrichten senden. Platzieren Sie dort additionally Ihre stabilen Anweisungen: wie Sie Assessments durchführen, welchen Paketmanager Sie verwenden sollten, Ihre Formatierungsregeln, wichtige architektonische Einschränkungen und die Verzeichnisse, die Claude nicht berühren sollte. Dies reduziert den Aufwand für wiederholte Eingabeaufforderungen über mehrere Sitzungen hinweg.
Ein weiterer wichtiger Teil besteht darin, es schlank zu halten. Fügen Sie keine Besprechungsnotizen, Designhistorien oder langen Implementierungsleitfäden ein. Die besten Ergebnisse erzielen Sie, wenn CLAUDE.md Funktioniert eher wie eine Nachschlagetabelle als wie ein riesiger Mind Dump.
# 3. Ausführliche Arbeit an Subagenten delegieren
Dies ist einer der wirklich hilfreichen Tipps, da er die Artwork und Weise verändert, wie der Kontext wächst. Subagenten sind isolierte Claude-Instanzen, die in ihrem eigenen Kontextfenster ausgeführt werden. Wenn ein Subagent ausgeführt wird, bleiben alle seine ausführlichen Ausgaben – Dateisuchen, Protokoll-Dumps, mehrstufige Argumentation – isoliert. Nur die Zusammenfassung kehrt zu Ihrem Hauptgespräch zurück. Dadurch kann Ihr Hauptthread viel sauberer bleiben. Aber hier gehen auch viele allgemeine Ratschläge schief. Subagenten sind nicht automatisch günstiger. Group-Assessments zeigen, dass ein Subagent für kleine Aufgaben, insbesondere einfache Shell-Aktionen oder schnelle Git-Operationen, verschwenderisch sein kann, da die Architektur selbst durch Eingabeaufforderungen, Instrument-Definitionen und zusätzliche Instrument-Aufruf-Roundtrips zusätzlichen Aufwand verursacht. Die praktische Regel lautet additionally nicht: „Für alles Subagenten verwenden“. Es heißt: „Verwenden Sie Subagenten, wenn die eingesparte Unordnung im Hauptkontext mehr wert ist als der Startaufwand.“
# 4. Claude auf genaue Dateien und Zeilenbereiche verweisen
Eine der schnellsten Möglichkeiten, Token zu verschwenden, besteht darin, Claude zu bitten, sich im Repo umzusehen, wenn das Drawback wirklich in einer oder zwei Dateien besteht. Je unklarer die Aufgabe, desto wahrscheinlicher ist es, dass Claude Token ausgibt, um mehrere Dateien zu öffnen, Sackgassen zu erkunden und den Kontext zu rekonstruieren, den Sie ihm direkt hätten geben können. Hier ist ein Beispiel.
Authentic:
„Sehen Sie sich den Authentifizierungscode an und sagen Sie mir, was falsch ist.“
Besser:
„Vergleichen
src/auth/session.tsZeilen 30 bis 90 mitsrc/api/login.tsZeilen 10 bis 60 und erklären Sie die Nichtübereinstimmung.
Das erste klingt natürlich, löst aber oft eine kostspielige Erkundung aus.
Ein weiterer Tipp ist Verwenden Sie den Planmodus vor teuren Operationen. Schalten Sie es um Shift+Tab. Im Planmodus gibt Claude einen Schritt-für-Schritt-Plan aus, ohne Änderungen vorzunehmen. Sie überprüfen den Plan, streichen alles Unnötige und kehren dann in den Normalmodus zurück. Dadurch wird die größte Quelle der Token-Verschwendung eliminiert: die Trial-and-Error-Ausführung, bei der Claude Dinge ausprobiert, auf Fehler stößt und iteriert – wobei jede Iteration Token kostet.
# 5. /compact proaktiv nutzen (nicht reaktiv)
Claude kann Ihre Sitzung automatisch komprimieren und Sie können sie auch ausführen /compact selbst. Aber das Timing ist wichtiger als man denkt.
Wenn Claude mehrere Dateien inspiziert, Befehle ausgeführt und ein paar falschen Hinweisen nachgegangen ist, enthält Ihre Sitzung normalerweise eine Menge Materials, das nicht mehr von Bedeutung ist. Das ist der richtige Zeitpunkt zum Verdichten. Anstatt den ganzen zusätzlichen Kontext in den nächsten Schritt zu übertragen, verkürzen Sie das Gespräch, sobald die wichtigen Teile klar sind, und fahren dann mit einer viel lockereren Sitzung fort.
Ein häufiger Fehler ist die Verwendung /compact zu spät. Viele Entwickler warten, bis Claude anfängt, Dinge zu vergessen oder eine Kontextwarnung anzeigt. Zu diesem Zeitpunkt ist die Sitzung bereits überlastet und die Zusammenfassung ist nicht mehr so sauber oder nützlich. Wenn Sie früher komprimieren, während die Sitzung noch „gesund“ ist, ist die Zusammenfassung viel besser. Sie behalten die wichtigsten Informationen bei, reduzieren den Lärm und vermeiden, unnötige Token in jeden zukünftigen Schritt einzuschleppen.
# 6. /Kontext vor der Optimierung prüfen
Eine der am meisten unterschätzten Ideen besteht darin, sich einfach nur den Kontext anzuschauen, der sie in Anspruch nimmt. Eine Menge Token-Verschwendung fühlt sich mysteriös an, bis man bedenkt, dass der teure Teil möglicherweise nicht die sichtbare Aufforderung ist. Es kann sich um eine große Datei handeln, die Claude zuvor gelesen hat, um eine angesammelte Werkzeugausgabe, um eine große Speicherdatei oder um den Mehraufwand an zusätzlichen Werkzeugen.
Der /context Der Befehl ist Ihr Diagnosetool. Bevor Sie Ihren gesamten Workflow ändern, prüfen Sie, was tatsächlich geladen oder wiederholt erneut gesendet wird. In vielen Fällen lässt sich die größte Verbesserung nicht durch eine bessere Aufforderung erreichen. Es kommt davon, dass man einen „stillen Täter“ entdeckt hat, der in jeder Kurve mitgefahren ist. Deshalb ist es besser, nicht blind zu optimieren. Überprüfen Sie zunächst, was in Ihrem Kontext steht. Entfernen oder reduzieren Sie dann die Teile, die tatsächlich die Blähungen verursachen.
# 7. Halten Sie die Einrichtung Ihrer Werkzeuge einfach
Claude Code kann eine Verbindung zu vielen externen Instruments und Datenquellen herstellen, was sehr leistungsstark ist – aber vernetztere Instruments können auch einen höheren Kontextaufwand bedeuten, sobald diese Instruments ins Spiel kommen. Wenn zu viele Instruments oder Helfer beteiligt sind, kann das Modell am Ende mehr Aufwand mit sich herumschleppen, als die Aufgabe wirklich benötigt. Halten Sie Ihr Setup schlank. Nutzen Sie Integrationen, die ein tatsächlich wiederkehrendes Drawback lösen. Laden Sie Claude Code nicht mit allen verfügbaren Fähigkeiten auf, nur weil Sie es können.
# Letzte Gedanken
Der beste Weg, die Nutzung von Claude-Code-Token zu reduzieren, besteht darin, nicht jede Eingabeaufforderung zu überwachen. Es geht darum, Ihren Arbeitsablauf so zu gestalten, dass Claude nur das sieht, was er wirklich braucht. Die größten Vorteile ergeben sich aus der Steuerung des automatischen Kontexts, der Einschränkung des Suchumfangs und der Verhinderung, dass laute Nebenarbeiten die Hauptsitzung verunreinigen.
Hören Sie auf, nur an Eingabeaufforderungen zu denken, und beginnen Sie, über die Kontextarchitektur nachzudenken.
Kanwal Mehreen ist ein Ingenieur für maschinelles Lernen und ein technischer Redakteur mit einer großen Leidenschaft für Datenwissenschaft und die Schnittstelle zwischen KI und Medizin. Sie ist Mitautorin des E-Books „Maximizing Productiveness with ChatGPT“. Als Google Era Scholar 2022 für APAC setzt sie sich für Vielfalt und akademische Exzellenz ein. Sie ist außerdem als Teradata Variety in Tech Scholar, Mitacs Globalink Analysis Scholar und Harvard WeCode Scholar anerkannt. Kanwal ist ein leidenschaftlicher Verfechter von Veränderungen und hat FEMCodes gegründet, um Frauen in MINT-Bereichen zu stärken.
