OpenAI wurde kürzlich veröffentlicht o1 und o1 professional in ihren 12 Tagen OpenAI – Stay-Updates, die unbegrenzten Zugriff für 200 US-Greenback bieten ChatGPT Professional Abonnement. Angesichts der vielen Spekulationen über ihre Fähigkeiten fragte ich mich: Lohnt sich die Investition in dieses Premium-Abonnement? Um diese Frage zu beantworten, habe ich diese beiden KI-Modelle in sechs herausfordernden Aufgaben gegeneinander antreten lassen. In diesem Artikel werden ihre Stärken, Schwächen und ihre Gesamtleistung untersucht. Am Ende werden Sie eine klare Vorstellung davon haben, ob das 200-Greenback-ChatGPT-Professional-Abonnement die richtige Wahl für Sie ist oder nicht!
Herausforderung 1. Ein Zebra-Drawback lösen
Als ersten Take a look at von o1 vs. o1 professional nehme ich ein Zebra-Drawback – schwieriges Degree Webseite. Mal sehen, wer es besser knackt!
Immediate:
Lösen Sie dieses Zebra-Drawback:
o1 Antwort:
Wenn man diese Antwort als Lösung ansieht, stellt sich heraus, dass sie falsch ist:
o1 professional Antwort:
Wenn man diese Antwort als Lösung ansieht, stellt sich heraus, dass sie richtig ist:
Beobachtung:
o1 professional brauchte viel mehr Zeit als o1, um zu antworten. o1 kann das Drawback nicht lösen, während o1 professional erfolgreich ist!
Urteil:
o1 ❌ | o1 professional ✅
Herausforderung 2: Unterschiede finden
Immediate:
Finden Sie 3 Unterschiede in den beiden Bildern:
o1 Antwort:
- Gegenstand in der Hand: Auf dem linken Bild hält sie einen Löffel. Im rechten Bild hält sie stattdessen eine Eistüte.
- Haarschmuck: Auf dem linken Bild sind ihre Haare schlicht. Auf dem rechten Bild trägt sie eine kleine rosa Schleife im Haar.
- Hintergrundobjekt: Im linken Bild steht auf dem Regal hinter ihr eine grüne Nähmaschine. Im rechten Bild wird die Nähmaschine durch einen einfachen grünen Kasten (oder Rahmen) ersetzt.
Beobachtung:
Nur der zweite Unterschied ist richtig, nämlich das fehlende Haaraccessoire, die restlichen 2 sind falsch.
o1 professional Antwort:
- Das Frisurenaccessoire des Mädchens: Auf dem rechten Bild hat sie eine rosa Schleife im Haar, die auf dem linken Bild nicht vorhanden ist.
- Was sie in ihrer Hand hält: Auf dem linken Bild hält sie einen Löffel. Im rechten Bild hält sie stattdessen eine Eistüte.
- Die Farbe der mittleren Kugel in der Eisschale: Im linken Bild ist die mittlere Kugel rosa, während sie im rechten Bild weiß geworden ist.
Beobachtung:
Nur der erste Unterschied ist richtig. Relaxation 2 ist falsch.
Sowohl o1 als auch o1 professional konnten nicht richtig antworten. Allerdings warfare o1 schneller bei der Generierung der Antwort.
Urteil:
o1 ❌ | o1 professional ❌
Herausforderung 3: Lösen Sie ein mathematisches Drawback
In dieser Herausforderung werde ich den Modellen ein Drawback zur Berechnung unbestimmter Integrale stellen. Mal sehen, wer es lösen kann!
Immediate:
Lösen Sie dieses mathematische Drawback:
Antwort von o1 und o1 professional (gleich):
Beobachtung:
Beide Modelle lieferten die richtige Antwort, aber das o1 warfare viel schneller als o1 professional bei der Lösungsfindung.
Urteil:
o1 ✅ | o1 professional ✅
Herausforderung 4: Artikel analysieren
Immediate:
Lesen Sie den Artikel – https://www.analyticsvidhya.com/weblog/2024/07/building-agentic-rag-systems-with-langgraph/, um den Prozess des Aufbaus einer Vektordatenbank für Wikipedia-Daten zu verstehen. Fassen Sie die wichtigsten Schritte kurz und bündig zusammen.
o1 Antwort:
o1 professional Antwort:
Beobachtung:
Die „o1 professional Antwort“ kommt der tatsächlichen Umsetzung im Artikel näher. Hier ist der Grund:
Der Artikel bietet eine viel detailliertere Schritt-für-Schritt-Implementierung, die Folgendes umfasst:
- Verwendung spezifischer Bibliotheken wie LangChain- und OpenAI-Einbettungen
- Laden von Wikipedia-Daten aus einem bestimmten Archiv
- Verwendung von Chroma als Vektordatenbank
- Implementierung erweiterter RAG-Komponenten wie:
- Umformulierung der Abfrage
- Einstufung der Dokumentenrelevanz
- Integration der Websuche
- Ein komplexer LangGraph-Workflow
Die Antwort von o1 professional fängt mehr Nuancen ein, indem sie Folgendes erwähnt:
- Spezifische Einbettungsmodelle (Satztransformatoren)
- Optionen für Vektordatenbanken
- Speicherung von Metadaten
- Abruf testen
- Integration mit einer RAG-Pipeline
Im Gegensatz dazu ist die erste „o1-Antwort“ allgemeiner gehalten und es fehlt ihr die im Artikel gezeigte technische Tiefe. Die Antwort von o1 professional kommt additionally der tatsächlichen Umsetzung des Artikels deutlich näher.
Urteil:
o1 ❌ | o1 professional ✅
Herausforderung 5: Bilderstellung
Immediate:
Erstellen Sie ein Bild einer Katze.
o1 Antwort:
o 1 Professional-Antwort:
Beobachtung:
Sowohl o1 als auch o1 professional konnten keine Bilder generieren, was darauf hindeutet, dass beide o1-Versionen die Bildgenerierung nicht unterstützen. Als ich jedoch GPT 4o die gleiche Aufforderung gab, erhielt ich die Antwort:
Daher kann man mit Sicherheit sagen, dass nur GPT 4o sowohl o1 als auch o1 professional bei der Bilderzeugung übertrifft!
Urteil:
o1 ❌ | o1 professional ❌
Herausforderung 6: Erstellen eines logischen Flussdiagramms
Immediate:
Erstellen Sie ein umfassendes Flussdiagramm, das das Reflexionsmuster in Agentic AI veranschaulicht.
o1 Antwort:
o1 professional Antwort:
Beide lieferten unvollständige Stream-Chats, daher beschloss ich, meine Eingabeaufforderung zu aktualisieren. Hier ist meine aktualisierte Eingabeaufforderung:
Neue Eingabeaufforderung:
Dies sind die Schritte, die zum Reflexionsmuster gehören –
- Generieren Sie die Erstausgabe
- Selbstüberprüfung/Kritik der Ausgabe
- Identifizieren Sie Fehler, Lücken oder Verbesserungsbereiche
- Verbesserungsvorschläge entwickeln
- Überarbeiten/verfeinern Sie die Ausgabe
- Wiederholen Sie die Schritte 2–5, bis ein zufriedenstellendes Ergebnis erzielt wird
- Erstellen Sie jetzt ein neues Flussdiagramm
o1 Antwort:
o1 professional Antwort:
Beobachtung:
Auch wenn der Inhalt in beiden Antworten derselbe ist, hat o1 definitiv gewonnen, indem es ein tatsächliches Flussdiagramm bereitstellte, während o1 Professional nur den richtigen Inhalt lieferte.
Urteil:
o1 ✅ | o1 professional ❌
Ergebnistabelle: o1 vs. o1 professional
Herausforderung | Urteil |
---|---|
Zebra-Drawback | o1 professional hatte Erfolg, warfare aber langsamer |
Finden Sie Unterschiede | Beide Modelle schnitten schlecht ab |
Mathe-Drawback | Beides richtig gelöst, o1 warfare schneller |
Artikel analysieren | o1 professional sorgte für mehr Tiefe |
Bilderstellung | Keiner von beiden konnte Bilder generieren (GPT 4o konnte) |
Erstellen eines logischen Flussdiagramms | o1 gewann durch die Erstellung eines tatsächlichen Flussdiagramms |
o1 professional scheint hinsichtlich der Tiefe und Genauigkeit der Problemlösung einen leichten Vorsprung zu haben, insbesondere bei komplexen Aufgaben wie der Lösung des Zebra-Issues und der Analyse technischer Artikel. Allerdings ist o1 tendenziell schneller und schneidet bei einfacheren Aufgaben intestine ab. Das Urteil scheint zu lauten, dass o1 Professional geringfügig besser ist, insbesondere bei komplexeren oder technischen Herausforderungen, die ein tieferes Verständnis erfordern.
Lesen Sie auch: Ist das neue o1-Modell besser als GPT-4o?
Schlussbemerkung
Obwohl o1 professional bei der Lösung komplexer Probleme vielversprechend ist, ist es wichtig, Ihre spezifischen Bedürfnisse und Ihr Price range zu berücksichtigen. Für einfache bis mittelschwere Aufgaben könnten GPT-4o oder andere günstigere Alternativen ausreichen. Wenn die Lösung komplexer Probleme Priorität hat und Sie bereit sind zu investieren, könnte o1 professional ein wertvolles Device sein.
Da OpenAI diese Modelle jedoch kontinuierlich verfeinert, könnte es sinnvoll sein, auf weitere Updates zu warten, bevor man eine endgültige Entscheidung trifft. OpenAI wird dem 200-Greenback-ChatGPT-Professional-Plan in Zukunft wahrscheinlich weitere Vorteile hinzufügen.
Was denken Sie darüber? Lass es mich im Kommentarbereich unten wissen.
Bleiben Sie dran Analytics Vidhya Weblog für weitere solch tolle Updates!