Anthropic hat gerade Claude Sonnet 5 veröffentlicht. Sonett. Musste es zweimal sagen.
Es ist das mittleres Sort der Familie Claude und das, das die meisten Menschen tatsächlich benutzen werden. Es ist schnell, leistungsfähig, kostengünstig im Betrieb und Kostenlose Nutzung für alle Benutzer ohne Abonnement.
In diesem Artikel gehen wir die neueste Model der Claude’s Sonnet-Familie durch Sonett 5. Wir haben es auf die Probe gestellt, um zu sehen, ob seine Agentenansprüche wahr sind oder nicht. Und wie sich dieses kostenlose Improve auf einen Stammkunden von Claude auswirkt.
Das Volksmodell

Sonnet 5 ist jetzt das Standardmodell für alle Benutzer. Wenn Sie Claude kostenlos nutzen, ist dies das Modell, mit dem Sie sprechen. Opus bleibt hinter einem kostenpflichtigen Plan zurückdaher ist Sonnet 5 für die meisten Menschen einfach das, was Claude ist. Kurz gesagt wurden folgende Verbesserungen vorgenommen:
- Aufgabenverfolgung: Erledigt komplexe, mehrstufige Aufgaben vollständig, anstatt vorzeitig aufzuhören.
- Selbstverifizierung: prüft und bestätigt die eigene Arbeit unaufgefordert.
- Verwendung des Agententools: plant, verwendet Instruments, führt aus und überprüft seine eigene Ausgabe.
- Niedrigere Kosten: günstiger professional Token als Opus, mit einem ermäßigten Einführungspreis.
- Verbesserte Zuverlässigkeit: lehnt schlechte Anfragen besser ab und halluziniert seltener.
Lernen Sie die Familie kennen
Claude gibt es in drei Größen. Haiku ist das Schnelle, Opus das Schwergewicht und Sonnet liegt bequem in der Mitte.
Hier ist der erwähnenswerte Teil: Sonnet ist gerade auf Model 5 umgestiegen. Haiku ist immer noch 4,5 und Opus ist 4,8, additionally Sonnet 5 ist das zuletzt umgebaute Modell der gesamten Produktreihe.

Es kostet weniger
Die Ausführung von Sonnet 5 ist weitaus günstiger als die Ausführung von Opus. Im Second ist es noch günstiger, dank eines Einführungspreises, der bis Ende August gilt. Für jeden, der es häufig betreibt, summiert sich dieser Abstand schnell.

Agentischer Fokus: Was es tatsächlich tut
Sonnet 5 chattet nicht nur. Es kann eine Aufgabe übernehmen und ausführen. Es erstellt einen Plan, verwendet Instruments wie einen Webbrowser und Ihre Dateien, erledigt die Arbeit und überprüft dann seine eigene Antwort, bevor es sie zurückgibt.

Die große Änderung gegenüber der letzten Model besteht darin, dass es beendet die Arbeit. Frühere Modelle blieben oft stehen nach der Hälfte längerer Aufgaben. Sonnet 5 neigt dazu, sie durchzuhalten, und überprüft sich selbst, ohne dass es dazu aufgefordert wird.
Es ist auch etwas sicherer, Dinge abzugeben. Es kann fragwürdige Anfragen besser ablehnen, ist schwerer auszutricksen und erfindet seltener Dinge als das Sonett davor (etwas, das vielen Leuten vielleicht nicht gefällt).
Praktisch: Testen der Agentenfähigkeiten
Check 1: Agentenfähigkeiten
Create a brief Python challenge known as agentic_sonnet_test. Inside it, create these information precisely:
# cart.py
class Cart:
def __init__(self):
self.objects = ()
def add(self, title, value, amount=1):
self.objects.append({"title": title, "value": value, "amount": amount})
def subtotal(self):
return sum(merchandise("value") for merchandise in self.objects)
def low cost(self):
complete = self.subtotal()
if complete > 100:
return complete * 0.1
return 0
def complete(self):
return self.subtotal() - self.low cost()
def receipt(self):
strains = ()
for merchandise in self.objects:
strains.append(f'{merchandise("title")}: ${merchandise("value")}')
strains.append(f"Whole: ${self.complete()}")
return "n".be part of(strains)
# test_cart.py
from cart import Cart
def test_subtotal_uses_quantity():
cart = Cart()
cart.add("Ebook", 10, amount=3)
cart.add("Pen", 2, amount=5)
assert cart.subtotal() == 40
def test_discount_applies_at_100_or_more():
cart = Cart()
cart.add("Keyboard", 100, amount=1)
assert cart.low cost() == 10
def test_total_after_discount():
cart = Cart()
cart.add("Monitor", 150, amount=2)
assert cart.complete() == 270
def test_receipt_shows_line_totals_and_quantity():
cart = Cart()
cart.add("Ebook", 10, amount=3)
receipt = cart.receipt()
assert "Ebook x3: $30" in receipt
assert "Subtotal: $30" in receipt
assert "Low cost: $0" in receipt
assert "Whole: $30" in receipt
Do the next:
1. Run the checks.
2. Examine the failure output.
3. Repair the implementation in cart.py.
4. Re-run the checks.
5. Maintain debugging till all checks cross.
6. Don't edit the checks.
7. On the finish, present:
- the ultimate cart.py
- the precise check command you ran
- the ultimate check outcome
- a brief clarification of what was damaged and the way you mounted it
Antwort:

Urteil: Sonnet 5 führte die Checks durch, bevor Code berührt wurde, diagnostizierte drei separate Fehler, anstatt blind zu patchen, und bearbeitete die Testdatei nie, um ein Bestehen zu erzwingen. Anschließend wurde alles erneut ausgeführt, um zu bestätigen, dass der Repair tatsächlich durchgeführt wurde. Sorgfältiges, diszipliniertes Debuggen, das den Kreis ordnungsgemäß schließt, anstatt nur Erfolg zu versprechen.
Check 2: Werkzeuggebrauch + Planung + Selbstkorrektur
Immediate:
I’m attempting to decide on the simplest on-line surroundings for working small Python experiments with a terminal. Evaluate Replit, GitHub Codespaces, and Google Colab utilizing present official docs or assist pages. For each, verify whether or not it helps:• creating information
• working shell or terminal instructions
• putting in packages
• saving or sharing the workspace
• lowest-friction setup for a newbiePlease don’t depend on reminiscence. Confirm from sources.
On the finish, give me:
• a comparability desk
• your suggestion
• hyperlinks to the pages you checked
• something you’re unsure about
Antwort:

Urteil: Sonnet 5 verzichtete darauf, sich auf den Speicher zu verlassen, und überprüfte die echte Dokumentation für jede Plattform und verglich alle drei anhand derselben Kriterien, sodass sich nichts einseitig anfühlte. Es endete mit einer ehrlichen Empfehlung und zeigte gleichzeitig auf, wo die eigene Einschätzung sei subjektiv. Gründlich, intestine beschafft und erfrischend offen über seine Grenzen.
Notiz: Ich nutze das Professional-Abonnement. Bei Sonnet 5 mit mittlerem Denkniveau wurden professional Agentenaufgabe etwa 3–5 % des Nutzungslimits genutzt. Das ist tremendous effizient.
Abschluss
Sonnet 5 versucht nicht, das intelligenteste Modell der Welt zu sein. Opus besitzt immer noch die schwierigsten Probleme. Es geht darum, das zu sein, was man jeden Tag erreicht.
Somit haben sich nicht nur die regulären Problemlösungsfähigkeiten der Sonnet-Modelle verbessert, sondern auch die dafür erforderliche Nutzung ist viel geringer (aufgrund der Verwendung eines Sonnet-Modells gegenüber einem Opus-Modell). Dies führt zu längeren/intensiveren Gesprächen, ohne dass die Angst vor der Nutzungsbeschränkung aufkommt.
Insgesamt haben die Endbenutzer, die möglicherweise kein Abonnement haben, gerade ein Improve gegenüber ihrem Standardmodus erhalten. Was diejenigen mit einem Abonnement betrifft, glaube ich nicht, dass Sonnet 5 Ihre Arbeitslast von Opus 4.8 übernehmen würde. Wenn es darum geht, sie über die API zu nutzen, ist das eine ganz andere Sache.
Häufig gestellte Fragen
A. Claude Sonnet 5 ist das Modell von Anthropic vom 30. Juni 2026, das für Agentenaufgaben, Codierung, Werkzeugnutzung und alltägliche berufliche Arbeit entwickelt wurde.
A. Ja. Es ist das Standardmodell für Free- und Professional-Benutzer, während Opus weiterhin kostenpflichtige Pläne bietet.
A. Die API-Preise beginnen bis zum 31. August 2026 bei 2 $ Enter und 10 $ Output professional 1 Mio. Token.
Melden Sie sich an, um weiterzulesen und von Experten kuratierte Inhalte zu genießen.
