Dieses Jahr struggle voller aufregender Veröffentlichungen im GenAI-Bereich von Claude Sonett 3.5 Zu OpenAIs o1 Zu Metas Lama 3.3 und viele mehr. Da so viel los ist, ist es ziemlich schwierig, ein Modell auszuwählen, für das es keine bessere Different gibt. Der jüngste Begin von DeepSeek V3 hat die GenAI-Welt mit seinen beeindruckenden Fähigkeiten erschüttert und gilt als das beste derzeit verfügbare Open-Supply-Modell. Additionally beschloss ich, es mit Claude 3.5 Sonnet zu testen. In diesem Artikel teste ich diese Modelle mit denselben Eingabeaufforderungen, um herauszufinden, welches eine bessere Reaktion bietet! Additionally, lasst uns unseren Kampf zwischen DeepSeek V3 und Claude Sonnet 3.5 beginnen!

Aufgabe 1: Lösen Sie ein Rätsel

Immediate: Sie sind in Eile zur Arbeit. Sie gießen sich eine Tasse schwarzen Kaffee ein, aber er ist zu heiß. Sie beabsichtigen, eine festgelegte Menge kalter Milch hinzuzufügen, wissen aber, dass der Kaffee auch danach noch einige Minuten abkühlen muss, bevor Sie ihn trinken können.
In diesem Fall kühlt der Kaffee stärker ab:
1) Fügen Sie sofort Milch hinzu und warten Sie dann einige Minuten, bevor Sie trinken.
2) Warten Sie einige Minuten und fügen Sie dann erst kurz vor dem Trinken Milch hinzu.

DeepSeek V3:

Claude Sonett 3.5:

Calude Sonett 3.5 - Puzzle

Beobachtung:

DeepSeek V3 schlägt vor, sofort kalte Milch hinzuzufügen, mit dem Argument, dass die Temperatur des Kaffees sofort sinkt und dann weiter abkühlt. Im Gegensatz dazu sagt Claude Sonnet 3.5, dass es besser ist, den schwarzen Kaffee zuerst abkühlen zu lassen – da eine heißere Flüssigkeit schneller Wärme verliert – und dann direkt vor dem Trinken Milch hinzuzufügen, um die Temperatur zusätzlich zu senken. Die meisten physikbasierten Erklärungen bevorzugen Claude Sonnet 3.5. Bleibt der Kaffee zunächst heißer, verliert er durch die schnellere Abkühlung aufgrund des größeren Temperaturunterschieds zur Umgebung mehr Wärme. Das Hinzufügen von Milch am Ende sorgt dann für eine abschließende Abkühlung, was zu einer niedrigeren Gesamttemperatur zum Trinkzeitpunkt führt.

Urteil:

DeepSeek V3 ❌ | Claude Sonnet 3.5 ✅

Aufgabe 2: Erstellen Sie ein Flussdiagramm

Ziel: Erstellen Sie ein logisches Flussdiagramm für ein Designmuster für mehrere Agenten. Es umfasst die folgenden Schritte:
1. Teilen Sie die Aufgabe auf: Definieren Sie das Gesamtziel, teilen Sie es in kleinere Teilaufgaben auf und ermitteln Sie, wie diese voneinander abhängig sind.
2. Rollen zuweisen: Weisen Sie jede Teilaufgabe dem am besten geeigneten Agenten zu und legen Sie dabei die Verantwortlichkeiten und Ergebnisse fest. 3. Kommunikation planen: Entscheiden Sie, ob Agenten direkt oder über einen Vorgesetzten kommunizieren und dabei einheitliche Formate verwenden.
4. Ausführen: Führen Sie Agenten parallel oder nacheinander aus und überwachen Sie ihre Ausgaben auf Vollständigkeit und Genauigkeit.
5. Validieren und Integrieren: Kombinieren Sie alle Agentenergebnisse zu einer endgültigen Antwort und prüfen Sie, ob Fehler oder Inkonsistenzen vorliegen.
6. Verfeinern: Sammeln Sie Suggestions, um Rollen oder Prozesse zu verbessern und Anweisungen oder Arbeitsabläufe nach Bedarf zu aktualisieren.

DeepSeek V3-Ausgabe:

+-----------------------------------------+
| Begin |
+-----------------------------------------+
|
v
+-----------------------------------------+
| 1. Break the Process |
| - Outline the general objective |
| - Cut up the objective into smaller subtasks |
| - Determine dependencies between subtasks|
+-----------------------------------------+
|
v
+-----------------------------------------+
| 2. Assign Roles |
| - Assign every subtask to the best-suited|
| agent |
| - Define obligations & deliverables|
+-----------------------------------------+
|
v
+-----------------------------------------+
| 3. Plan Communication |
| - Resolve if brokers talk immediately |
| or by way of a supervisor |
| - Use constant communication codecs |
+-----------------------------------------+
|
v
+-----------------------------------------+
| 4. Execute |
| - Run brokers in parallel or sequence |
| - Monitor outputs for completeness & |
| accuracy |
+-----------------------------------------+
|
v
+-----------------------------------------+
| 5. Validate & Combine |
| - Mix all agent outcomes into one |
| ultimate reply |
| - Test for errors or inconsistencies |
+-----------------------------------------+
|
v
+-----------------------------------------+
| 6. Refine |
| - Collect suggestions to enhance roles or |
| processes |
| - Replace directions or workflows as |
| wanted |
+-----------------------------------------+
|
v
+-----------------------------------------+
| Finish |
+-----------------------------------------+

Claude Sonnet 3.5 Ausgabe:

Multiagentensystem - Claude

Beobachtung:

Claude Sonnet 3.5 ist besser, weil es Entscheidungspunkte und Rückkopplungsschleifen zeigt. Multiagentensysteme erfordern häufig erneute Überprüfungs- und Verfeinerungsschritte. Wenn Sie nur eine einfache Liste benötigen, könnte DeepSeek V3 ausreichen. Für reale Arbeitsabläufe, die iterative Verbesserungen und Verzweigungen erfordern, bietet Claude Sonnet 3.5 eine klarere, vollständigere Struktur.

Urteil:

DeepSeek V3 ❌ | Claude Sonett 3.5

Aufgabe 3: Finden Sie Grammatikfehler

Immediate: Analysieren Sie den Inhalt unten und pay attention Sie die Anzahl der Grammatikfehler im Textual content auf.
Trotz der Vergänglichkeit der Existenz bleiben viele in ihren Illusionen verstockt. Zweifellos unterstreichen kurzlebige Veränderungen kosmischer Nuancen die labyrinthische Komplexität, mit der selbst die gelehrtesten Geister konfrontiert sind. Bis wir unsere kollektiven Energien bündeln, um diese belastenden Feinheiten zu überwinden, wird die Menschheit weiterhin von unermesslichen Ratlosigkeiten fasziniert sein. Doch sind wir wirklich dazu prädestiniert, in existenziellen Konflikten stecken zu bleiben? Da wir eine anthropomorphe Spezies sind, ist unsere vielleicht größte Torheit die selbstgefällige Selbstgefälligkeit, die sich manifestiert, wenn Klarheit geboten ist. Die Pflicht liegt in der Selbstbeobachtung, denn das Erkennen immaterieller Zwänge fördert die Befreiung. Das Ziel des Wissens treibt uns voran und ebnet uns einen unsicheren, aber unverzichtbaren Weg. Passen Sie auf.

DeepSeek V3-Ausgabe:

Hier ist eine Liste der Fehler im Absatz:

  1. „Existenz“ – Falsche Schreibweise. Korrektur: „Existenz“.
  2. „Unterstriche“ – Fehler bei der Subjekt-Verb-Übereinstimmung. Korrektur: „unterstreichen“.
  3. „Bis“ – Falsche Schreibweise. Korrektur: „Bis“.
  4. „vorherbestimmt“ – Falsche Wortverwendung. Korrektur: „prädestiniert“.
  5. „anthropomorph“ – Falsche Schreibweise. Korrektur: „anthropomorph“.
  6. „Selbstzufriedenheit“ – Falsche Wortverwendung. Korrektur: „Selbstzufriedenheit“.
  7. „Präsizium“ – Falsche Schreibweise. Korrektur: „Abgrund“.

Fehlerliste:

(„Existenz“, „Unterstriche“, „Bis“, „vorherbestimmt“, „anthropomorph“, „Selbstzufriedenheit“, „Vorhersage“)

Claude Sonnet 3.5 Ausgabe:

Hier sind alle im Absatz gefundenen Fehler, aufgelistet in der Reihenfolge ihres Auftretens:

  1. „Existenz“ – Falsche Schreibweise (sollte „Existenz“ lauten)
  2. „underscores“ – Subjekt-Verb-Übereinstimmungsfehler (sollte „underscore“ sein, da „shifts“ Plural ist)
  3. „Bis“ – Falsche Schreibweise (sollte „Bis“ lauten)
  4. „predestinated“ – Falsche Wortform (sollte „predestined“ lauten)
  5. „Existenzielle Flächenbrände“ – Fehlendes Fragezeichen am Satzende
  6. „anthropomorph“ – Falsche Schreibweise (sollte „anthropomorph“ lauten)
  7. „presipice“ – Falsche Schreibweise (sollte „precipice“ lauten)
  8. Stilistisch gesehen ist der Punkt nach „Take heed“ unnötig, da es sich um einen Befehl/Imperativ handelt

Der Absatz enthält 8 eindeutige Fehler, die hauptsächlich aus Rechtschreibfehlern, Problemen mit der Subjekt-Verb-Übereinstimmung und Zeichensetzungsfehlern bestehen.

Beobachtung:

Die Reaktion von Claude Sonnet 3.5 ist besser, da mehr Probleme erfasst werden. Es weist nicht nur auf Rechtschreib- und Subjekt-Verb-Fehler hin, wie es DeepSeek V3 tut, sondern weist auch auf ein fehlendes Fragezeichen hin und schlägt eine stilistische Verbesserung für „Take heed“ vor. Diese breitere Abdeckung macht die Analyse insgesamt gründlicher.

Urteil:

DeepSeek V3 ❌ | Claude Sonett 3.5

Aufgabe 4: Berechnen Sie die Gewinnwahrscheinlichkeit

Immediate: Wie hoch ist die Siegwahrscheinlichkeit für jedes Group in diesem Spiel?

Cricket-Match – DeepSeek V3 gegen Claude Sonnet 3.5

DeepSeek V3-Ausgabe:

Cricket-Match V3

Claude Sonnet 3.5 Ausgabe:

Cricket-Match Claude

Beobachtung:

Claude Sonnet 3.5 bietet eine genauere, kontextkonsistente Lesart der Anzeigetafel- und Laufverfolgungsanforderungen, was zu einer realistischeren Wahrscheinlichkeitsschätzung führt. Dabei werden die verbleibenden Overs und die erforderliche Run-Charge berücksichtigt. DeepSeek V3 interpretiert die Match-Scenario falsch, sodass seine Schlussfolgerung weniger zuverlässig ist. Folglich, Die Reaktion von Claude Sonnet 3.5 ist besser weil es mit den korrekten Spieldetails und der Normal-Cricket-Verfolgungslogik übereinstimmt.

Urteil:

DeepSeek V3 ❌ | Claude Sonnet 3.5 ✅

Aufgabe 5: Physikalisches Downside

Immediate: Eine schwerelose Schnur verbindet zwei identische Metallkugeln. Die Mitte der Schnur liegt über der Tischkante. Sie lassen beide Bälle gleichzeitig los. Was passiert früher: Ball 1 fliegt vom Tisch oder Ball 2 landet auf der Seite?

DeepSeek V3-Ausgabe:

Verstehen Sie das Setup

  • Zwei identische Metallkugeln sind durch eine Schnur verbunden.
  • Die Schnur wird so platziert, dass ein Ball auf dem Tisch liegt (Ball 1) und der andere vom Tisch hängt (Ball 2).
  • Beide Bälle werden gleichzeitig losgelassen.

Auf die Kugeln wirkende Kräfte

  • Ball 1 (auf dem Tisch):
    • Wird durch die Schnur horizontal zur Tischkante gezogen.
  • Ball 2 (hängt vom Tisch):
    • Durch die Schwerkraft nach unten und durch die Schnur leicht nach oben gezogen.

Was passiert früher?

  • Die Schwerkraft (die Ball 2 nach unten zieht) ist eine stärkere Kraft als der horizontale Zug auf Ball 1.
  • Daher, Ball 2 trifft früher auf der Tischkante als Ball 1 vom Tisch fliegt.

Endgültige Antwort: Ball 2 trifft früher auf die Tischkante.

Claude Sonnet 3.5 Ausgabe:

Ersteinrichtung

  • Zwei identische Metallkugeln, die durch eine schwerelose Schnur verbunden sind
  • Der Mittelpunkt der Schnur liegt über der Tischkante
  • Ball 1 liegt auf dem Tisch, Ball 2 hängt über die Kante

Wenn Bälle freigegeben werden

  • Ball 2 beginnt herunterzufallen
  • Ball 1 beginnt sich in Richtung Rand zu bewegen
  • Die Saite verbindet ihre Bewegung

Die Physik

  • Der Abwärtszug von Ball 2 wird gleichmäßig über die Saite verteilt
  • Beide Kugeln bewegen sich mit der halben Erdbeschleunigung (g/2)
  • Beide Kugeln legen die gleiche Strecke zurück (halbe Saitenlänge)

Das Ergebnis

  • Da beide Bälle:
    • Fahren Sie die gleiche Strecke zurück
    • Bewegen Sie sich mit der gleichen Beschleunigung
    • Beginnen Sie gleichzeitig
  • Sie werden ihr Ziel genau zur gleichen Zeit erreichen

Endgültige Antwort: Ball 1 erreicht die Tischkante genau im selben Second, in dem Ball 2 die Tischkante berührt.

Beobachtung:

Claude Sonnet 3.5 ist korrekter. Unter idealen (reibungsfreien) Bedingungen legt jeder Ball die gleiche horizontale Strecke mit der gleichen horizontalen Beschleunigung zurück, sodass Ball 1 genau dann wegfliegt, wenn Ball 2 seitlich auftrifft. DeepSeek V3 priorisiert fälschlicherweise den Abwärtszug der Schwerkraft auf Ball 2, aber der Schlüsselfaktor ist der horizontale Zug von der Schnur, der für beide Bälle symmetrisch ist. Folglich erreichen sie in einem rein physikalischen Szenario gleichzeitig die Kante/Seite des Tisches.

Urteil:

DeepSeek V3 ❌ | Claude Sonett 3.5

Endgültiges Ergebnis: DeepSeek V3 vs. Claude Sonnet 3.5

Aufgabe Gewinner
Aufgabe 1: Lösen Sie ein Rätsel Claude Sonett 3.5
Aufgabe 2: Erstellen Sie ein Flussdiagramm Claude Sonett 3.5
Aufgabe 3: Finden Sie Grammatikfehler Claude Sonett 3.5
Aufgabe 4: Gewinnwahrscheinlichkeit berechnen Claude Sonett 3.5
Aufgabe 5: Physikalisches Downside Claude Sonett 3.5

Lesen Sie auch:

Schlussbemerkung

Die Aufgaben in diesem Artikel geben einen Einblick in die Fähigkeiten von DeepSeek V3 im Vergleich zu Claude 3.5 Sonnet, sind aber nur ein kleiner Teil dessen, was diese Modelle leisten können. Vermeiden Sie es, sie ausschließlich auf der Grundlage dieser Ergebnisse zu beurteilen. Erkunden und nutzen Sie stattdessen jedes Modell entsprechend Ihren spezifischen Bedürfnissen und Anforderungen.

Haben Sie DeepSeek V3 oder Claude 3.5 Sonnet ausprobiert? Teilen Sie Ihre Erfahrungen und Erkenntnisse in den Kommentaren unten!

Hallo, ich bin Nitika, eine technisch versierte Content material-Erstellerin und Vermarkterin. Kreativität und das Lernen neuer Dinge sind für mich selbstverständlich. Ich habe Erfahrung in der Erstellung ergebnisorientierter Content material-Strategien. Ich kenne mich intestine mit Search engine marketing-Administration, Key phrase-Operationen, Net-Content material-Schreiben, Kommunikation, Content material-Strategie, Redaktion und Schreiben aus.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert