Es ist Dezember – die Welt wird langsamer und in manchen Ecken fällt Schnee. Aber OpenAI? Sie fangen gerade erst an. In wahrhaft festlicher Stimmung starten Sam Altman und sein Workforce eine 12-tägige Geschenktour, und das erste ist eine große Sache: OpenAI o1 – ihr bisher leistungsfähigstes Modell. Monatelang conflict GPT-4 die erste Wahl für LLM für alles, aber jetzt ist o1 da, um die Dinge aufzumischen. Was bringt es auf den Tisch? In diesem Weblog werden wir OpenAIs o1 und GPT-4o für ein paar Aufgaben gegeneinander antreten lassen und sehen, welches Modell als Sieger hervorgeht. Fangen wir an.
OpenAI o1 – Was ist neu?
Das neueste o1-Modell von OpenAI ist eine verfeinerte Model seines o1-Preview-Modells, das im September 2024 veröffentlicht wurde. Es wurde entwickelt, um komplexere Aufgaben mit größerer Präzision und Geschwindigkeit zu bewältigen.
- Im Vergleich zu seinem Vorgänger o1-preview zeigt o1 eine bemerkenswerte Fähigkeit, bei einfacheren Problemen prägnanter zu denken. Die Denkzeit ist proportional zum Schwierigkeitsgrad der Anfrage.
- Laut OpenAI übertrifft o1 seinen Vorgänger o1-Preview deutlich beim mathematischen Denken und bei codierungsbezogenen Aufgaben.
- o1 verfügt über multimodale Funktionen, was bedeutet, dass es mit Textual content, Bildern und Audio arbeiten kann, während die Vorschau von o1 nur auf Textual content beschränkt conflict.
Erfahren Sie mehr: OpenAI o1 ist da: Das fortschrittlichste Modell steht zur VERWENDUNG zur Verfügung!
Wie greife ich auf o1 zu?
o1 ist in ChatGPT Plus und verfügbar ChatGPT Professional planen. Es ist im kostenlosen Plan nicht verfügbar. Während der ChatGPT Professional-Plan unbegrenzte Chats mit o1 erlaubt, erlaubt der Plus-Plan nur eine begrenzte Anzahl von Chats mit o1. So greifen Sie auf o1 zu:
- Gehen Sie zu ChatGPT und melden Sie sich bei Ihrem Professional/Plus-Konto an.
- Oben auf der linken Seite des Bildschirms können Sie unter der Modellauswahl das Modell auswählen, mit dem Sie arbeiten möchten.
o1 vs. GPT-4o: Der Showdown
Auch wenn die o1-Vorschau in den letzten Monaten für Aufsehen gesorgt hat, hat sich GPT-4o als erste Wahl sowohl für technische als auch für nicht-technische Benutzer von ChatGPT behauptet. GPT-4o wurde im Mai 2024 auf den Markt gebracht und ist ein raffiniertes multimodales Modell, das für seine Präzision, Geschwindigkeit und Vielseitigkeit bekannt ist.
Es verarbeitet Textual content, Bilder und Audio nahtlos mit menschenähnlichen Reaktionszeiten und modernster Genauigkeit. Es zeichnet sich durch komplexe Argumentation und differenziertes Verständnis aus und beeindruckt durch seine beeindruckende Qualität 88,7 % Punktzahl auf MMLU-Benchmarks und setzt damit einen hohen Commonplace für multimodale KI.
Jetzt sticht o1 mit seinen außergewöhnlichen Leistungen in den Bereichen Mathematik, Codierung und komplexe Problemlösung ins Rampenlicht. Es ist ein kühner Anspruch an die Spitze, aber übertrifft o1 tatsächlich GPT-4o als ultimatives Modell?
Um das herauszufinden, stellen wir beides mit fünf herausfordernden Aufgaben auf die Probe. Hier sind die 5 Aufgaben:
- Das Downside verstehen und ein Flussdiagramm entwerfen
- Bildanalyse mit Wissenschaft
- Bildanalyse mit Mathematik
- Lösen Sie ein Sudoku-Rätsel
- Bilderzeugung
Mal sehen, welcher LLM als unangefochtener Champion hervorgeht!
Herausforderung 1: Verstehen Sie das Downside und entwerfen Sie ein Flussdiagramm
Immediate: „Ich benötige ein einfaches Flussdiagramm und eine detaillierte Erläuterung der Instruments und Technologien, die zur Implementierung eines Stimmungsanalysesystems erforderlich sind.
Das System sollte über eine Nachrichten-API aktienbezogene Nachrichten abrufen, die Stimmung analysieren (positiv, negativ oder impartial) und den Kunden eine 140-stellige Zusammenfassung und die Stimmung liefern.“
Ergebnis:
Mit GPT-4o erhielten wir eine konzeptionelle Beschreibung des Flussdiagramms zusammen mit einem vagen Bild, das ein Flussdiagramm darstellt. Obwohl die Textbeschreibung die Schritte präzise und genau darstellt, ist das Diagramm voller Rechtschreibfehler und einem verwirrenden Ablauf der Ereignisse.
Mit o1 haben wir ein einfaches, aber sauberes Flussdiagramm ohne Rechtschreibfehler erhalten. Dann haben wir in der Textbeschreibung die Particulars zu jedem Teil des Flussdiagramms erhalten – intestine erklärt. Wir haben einige zusätzliche Informationen zu anderen Instruments und Technologien erhalten, die wir für diese Aufgabe verwenden könnten. Abschließend erhielten wir eine prägnante Zusammenfassung, in der jeder Schritt kurz erklärt wird – eine umfassende Finish-to-Finish-Antwort!
Urteil: Für diese Aufgabe schlug o1 den Ball direkt aus dem Park.
Herausforderung 2: Bildanalyse mit Wissenschaft
Immediate: „Berechnen Sie die Ausgabe dieses Schaltplans.“
(Referenz)
Ergebnis:
GPT-4o identifiziert den Schaltplan korrekt und identifiziert einige Komponenten des Bildes korrekt, einschließlich der Eingangs- und Ausgangsspannung. Allerdings ist es nicht möglich, die Grafik im Bild zu lesen, um Erkenntnisse über die Spannungswerte zu gewinnen. Vielmehr fordert es uns in seiner Antwort auf, diese Werte zur weiteren Berechnung einzugeben.
o1, die Analyse des Bildes dauert einige Sekunden. Es identifiziert alle Komponenten korrekt und liest auch die Werte für jede Komponente aus dem Bild. Das Modell beschreibt den innerhalb der Schaltung ausgeführten Vorgang. Anschließend berechnet es die wichtigsten Parameter der Schaltung, berücksichtigt auch kleine Lastfaktoren und meldet diese. Eine Meisterleistung von o1! Es verstand nicht nur die Aufgabe, sondern las auch alle Werte aus den Diagrammen im Bild, um die Ausgabewerte zu berechnen – korrekt und prägnant!
Urteil: Offensichtlich ist o1 ein Meister der Physik!
Herausforderung 3: Bildanalyse mit Mathematik
Immediate: „Wie hoch ist die Siegwahrscheinlichkeit für jedes Workforce in diesem Spiel?“
Ergebnis:
Generiert von GPT-4o
Erstellt von o1
GPT-4o hat das Spiel zwar richtig verstanden, aber das gespielte Format konnte es nicht richtig verstehen. Andere Particulars im Bild wurden korrekt gelesen, z. B. der Spielstand und die vom Bowler geschossenen Pforten. Dennoch conflict die Analyse insgesamt nicht detailliert und sie gab uns keine Auskunft über die Siegwahrscheinlichkeit eines Groups.
o1, ich habe die Aufgabe verstanden und die Analyse des Bildes hat hervorragende Arbeit geleistet. Von der korrekten Identifizierung des Spiels und des Codecs bis hin zu Particulars zur Mannschaft, die aufstellt, und auch zur Teepause. Schließlich leistet es fantastische Arbeit bei der Berechnung der Siegwahrscheinlichkeit für jedes Workforce und liefert gute Gründe, die seine Antwort stützen.
Urteil: o1 macht den Job und macht es intestine!
Herausforderung 4: Lösen Sie ein Sudoku-Rätsel
Immediate: „Lösen Sie das folgende Sudoku und geben Sie die endgültige Lösung als Bild an.“
Ergebnis:
Erstellt von o1
GPT-4o generiert die Antwort sofort als Matplotlib-Diagramm. Die Antwort conflict schnell, aber falsch.
o1 hingegen braucht einige Zeit, um über die Lösung nachzudenken. Es setzt sorgfältig Punkte an die Stellen der Leerstellen und versucht dann mehrere Iterationen, erklärt die Platzierungen und identifiziert dann auch den Fehler in jeder seiner Lösungen, aber am Ende ist das Endergebnis, das es generiert, immer noch nicht die richtige Lösung. Die Antwort conflict verspätet, intestine durchdacht und dennoch falsch!
Urteil: Für diese Aufgabe lieferten sowohl GPT-4o als auch o1 nicht die richtige Lösung, nämlich:
Herausforderung 5: Bildgenerierung
Immediate: „Erstellen Sie ein Bild von einem Hund, der nahe der Küste rennt.“
Ergebnis:
GPT-4o erzeugt schnell das Bild eines glücklichen Hundes, der am Meeresufer herumspringt. Erledigung der von uns gewünschten Aufgabe schnell und effizient. Oh und was für ein süßer Hund!
o1 kann derzeit keine Bilder generieren. Daher erhalten wir lediglich eine detaillierte Eingabeaufforderung, mit der wir mithilfe eines KI-Bildgenerators ein Bild erstellen können. Scheint noch nicht mit DALL.E verknüpft zu sein!
Urteil: Bei dieser Herausforderung ist GPT-4o ungeschlagen.
Abschluss
o1 übertrifft GPT-4o zweifellos in den meisten Fällen. Mit seinen verbesserten Argumentations- und logischen Denkfähigkeiten ist es hervorragend darin, komplexe Fragen zu verstehen und relevantere, präzisere Antworten zu generieren. Es ist schneller als die o1-Vorschauversion und in seinen Antworten deutlich prägnanter.
Aber ist es perfekt? Ist es AGI? Sicherlich nicht. Wie jedes Modell hat auch o1 seine Grenzen. Es kann zu falschen Antworten führen und möglicherweise mehrere Iterationen erfordern, um zum gewünschten Ergebnis zu gelangen.
Dennoch ist o1 ein bemerkenswertes Werkzeug für Forscher, Wissenschaftler, Designer und sogar Studenten. Seine außergewöhnlichen Fähigkeiten zur Problemlösung, seine große Liebe zum Element und seine erweiterten Sprachfunktionen machen es zu einer leistungsstarken Ressource. Ob es darum geht, komplexe Aufgaben zu bewältigen oder kreative Arbeitsabläufe zu unterstützen, o1 birgt ein enormes Potenzial zur Steigerung von Produktivität und Innovation.
Häufig gestellte Fragen
A. o1 ist die neueste Model des von OpenAI eingeführten o1-Vorschaumodells. Dieses Modell zeichnet sich durch fortgeschrittenes Denken, logisches Denken, Mathematik und codierungsbezogene Aufgaben aus.
A. CHatGPT professional ist der neueste Plan von OpenAI, der die unbegrenzte Nutzung der neuesten OpenAI-Modelle wie o1 professional, o1, GPT-4o, GPT – 4o mini und mehr beinhaltet. Dieser Plan soll erweiterte Funktionen und Fähigkeiten umfassen, um die Geschwindigkeit und Effizienz dieser Modelle zu verbessern.
A. o1 ist besser als GPT 4o für Aufgaben wie fortgeschrittenes Denken, Mathematik, Naturwissenschaften auf Doktoratsniveau und Programmieren. GPT-4o eignet sich hervorragend für alltägliche Aufgaben, bei denen es um die Textual content- und Bildgenerierung geht.
A. Ja, Sie können o1 im ChatGPT Plus-Plan verwenden. Die Verwendung in diesem Plan ist jedoch begrenzt.
A. Ja, o1 ist multimodales LLM. Es kann Textual content-, Bild- und Audiodateien verarbeiten.