Nur Tage nach dem Begin der GPT 4.1 FamilieOpenai hat seine O3- und O4-Mini-Argumentationsmodelle veröffentlicht und einen Sprung in Richtung Agi gemacht (Künstliche allgemeine Intelligenz). Die O3- und O4-Mini sind nicht nur AI-Modelle; Sie sind KI-Systeme, die mit fortschrittlicher Intelligenz, Autonomie, Instruments-Aufruffunktion und realen Software program-Engineering-Fähigkeiten ausgestattet sind. Diese neuen Modelle warten nicht darauf, dass Sie die Arbeit erledigen. Sie gehen voran, verwenden ihre Werkzeuge und automatische Aufgaben selbst! Lassen Sie uns additionally die Funktionen, Benchmark-Leistungen und Anwendungen der neuen O-Serie-Modelle-O3 und O4-Mini-untersuchen.
Was sind O3 und O4-Mini?
O3 und O4-Mini sind die neuesten Argumentationsmodelle von Openai, die frühere Modelle in der O-Serie wie O1 und O3-Mini erfolgen und ersetzen. Im Gegensatz zu Commonplace -LLMs, die sich hauptsächlich auf die Mustererkennung und die Textgenerierung konzentrieren, verwenden diese Argumentationsmodelle einen längeren internen „Denkkette“.
Dies ermöglicht es ihnen, komplexe Probleme aufzubauen, verschiedene Schritte zu bewerten und zu genaueren und nachdenklicheren Lösungen zu erreichen. Daher zeichnen sie sich insbesondere in Domänen wie STEM, Codierung und logischem Abzug aus. Darüber hinaus sind diese Modelle die ersten in der O-Serie, die die gesamte Suite von Instruments, die innerhalb von ChatGPT verfügbar sind, agenten und kombiniert werden können.
O3 ist das bisher fortschrittlichste Argumentationsmodell von OpenAI und ist in Aufgaben hervorgerufen, die ein tiefes analytisches Denken in verschiedenen Bereichen erfordern. Gebaut mit dem 10 -fachen des Rechens in eingelegt O1Dieses Modell führt die Fähigkeit ein, „mit Bildern zu denken“. Dies ermöglicht es, über visuelle Eingaben direkt innerhalb seiner kognitiven Prozesse zu verarbeiten und zu verarbeiten, was phänomenal ist
O4-Mini dient als kompaktes, effizientes und kostengünstiges Gegenstück zu O3. Obwohl es kleiner ist, bietet es eine beeindruckende Leistung, insbesondere in Bereichen wie Mathematik, Codierung und visuellen Aufgaben. Sein optimiertes Design sorgt für schnellere Reaktionen und einen höheren Durchsatz, was es für Anwendungen geeignet ist, bei denen Geschwindigkeit und Effizienz von größter Bedeutung sind.

Andere Modelle: OpenAI hat auch eine o4-mini-hohe Variante veröffentlicht, die mehr Zeit für potenziell zuverlässigere Antworten braucht.
Zukünftige Veröffentlichungen: Eine noch leistungsstärkere Model, O3-Professional, die mehr Rechenressourcen nutzt, ist in naher Zukunft für die Freigabe an Professional-Abonnenten geplant.
Lesen Sie auch: LAMA 4 Fashions: Meta AI ist offen die besten Beschaffung
Schlüsselmerkmale von O3 und O4-Mini
Hier sind einige der wichtigsten Merkmale dieser fortschrittlichen und leistungsstarken Argumentationsmodelle:
- Agentenverhalten: Sie weisen proaktive Fähigkeiten zur Problemlösung auf, die den besten Ansatz für komplexe Aufgaben autonom ermitteln und mehrstufige Lösungen effizient ausführen.
- Erweiterte Werkzeugintegration: Die Modelle verwenden nahtlos Instruments wie Webbrowsing, Codeausführung und Bildgenerierung, um ihre Antworten zu verbessern und komplexe Abfragen anzugehen effektiv.
- Multimodales Denken: Sie können visuelle Informationen direkt in ihre Argumentationskette verarbeiten und integrieren, mit denen sie Bilder neben Textdaten interpretieren und analysieren können.
- Erweiterte visuelle Argumentation („mit Bildern denken“): Die Modelle können komplexe visuelle Eingänge wie Diagramme, Whiteboard-Skizzen oder sogar unscharfe/minderwertige Fotos interpretieren. Sie können diese Bilder sogar als Teil ihres Argumentationsprozesses manipulieren (Zoom, Ernte, Drehen, Verbesserung), um relevante Informationen zu extrahieren.
Reflektieren O3 und O4-Mini Agi?
Beide Modelle „O-Serie“ sind speziell so konzipiert, dass sie tiefer denken und komplexe, mehrstufige Argumentation durchführen, bevor sie eine Antwort erzeugen.
Wenn O3 ein Drawback zu lösen ist, wird zunächst Brute Drive verwendet, um eine Lösung zu finden. Das Modell findet dann eine intelligentere Möglichkeit, die Berechnung durchzuführen, und präsentiert es in einem ordentlichen Format. Es wird die Antwort weiter überprüft und es vereinfacht, dem Benutzer eine sehr einfache und leicht verständliche Antwort zu bieten.

Obwohl ein Teil dieses Denkprozesses auf dem Pc und Coaching basiert, wurden diese Modelle nicht explizit gelehrt, die Antwort zu vereinfachen oder sie erneut zu überprüfen. Dies macht sie selbst entwickelnde und selbstlernen Modelle, die uns Agi näher annähern.
Darüber hinaus kann O3 autonom entscheiden, wann und wie die verschiedenen in ChatGPT verfügbaren Instruments (Websuche, Python-Datenanalyse, Dall · E-Bilderzeugung und Imaginative and prescient) zur Lösung komplexer, facettenreicher Abfragen gelöst werden können. Es kann mehrere Instrument -Aufrufe ketten, die Net iterativ durchsuchen, Ergebnisse analysieren und Informationen über Modalitäten hinweg synthetisieren.
Lesen Sie auch: Gegenüber Agi: Technologien, Herausforderungen und der Weg vor uns
Verfügbarkeit von O3 und O4-Mini
Beide Modelle sind über die ChatGPT -Plattform von OpenAI und API -Diensten zugänglich:
Chatgpt -Zugriff: Benutzer, die mit Chatgpt Plus-, Professional- und Teamplänen abonniert sind, können O3-, O4-Mini- und O4-Mini-hohe Modelle direkt auf der Chat-Schnittstelle verwenden. Unternehmens- und Bildungsnutzer erhalten innerhalb einer Woche Zugriff. Freistufe Benutzer können O4-Mini erleben, indem sie die Choice „Denken“ auswählen, bevor sie ihre Abfragen einreichen.
API -Zugang: Entwickler können O3- und O4-Mini über OpenAIs Chat-Abschlüsse-API und die API von OpenAI integrieren und in ihre Anwendungen integrieren Antworten APIAktivieren Sie kundenspezifische KI -Lösungen auf verschiedenen Plattformen.
O3 und O4-Mini: Benchmark-Leistung
Sowohl O3- als auch O4-Mini-Modelle haben in einer Reihe von Commonplace-Benchmark-Exams außergewöhnliche Funktionen gezeigt.

- Swe-Lancer: Die hohen Varianten dieser beiden Modelle funktionieren in diesem kodierenden Benchmark außergewöhnlich intestine und schämen ihre Vorfahren.
- SWE-Bench verifiziert (Software program-Engineering): O3 erzielte einen Wert von 69,1%, während O4-Mini mit 68,1percentgenau folgte. Beide Modelle übertrafen frühere Modelle wie O3-Mini (49,3%) und Wettbewerber wie O3-Mini (49,3%). Claude 3.7 Sonett (63,7%).
- Aider Polyglot (Code -Bearbeitung): Beide Modelle erweisen sich als das Beste aus OpenAI, wenn es um diesen Code -Bearbeitungs -Benchmark geht und neue Datensätze aufstellen.

- Aime 2025 (Mathematik): O4-Mini hat hier einen neuen Benchmark gesetzt, indem er 99,5% erzielte, wenn er mit einem Python-Dolmetscher ausgestattet ist, während O3 direkt dahinter liegt und 98,4% erzielt.
- Codeforces (Wettbewerbsprogrammierung): O4-Mini erreichte eine ELO-Bewertung von 2719, was seine fortschrittlichen Fähigkeiten zur Problemlösung in wettbewerbsfähigen Programmierszenarien widerspiegelte. In der Zwischenzeit erzielt O3 2706 und erzielte immer noch exponentiell besser als die anderen Modelle.
- GPQA Diamond (Wissenschaft auf PhD-Ebene): O3 zeigten ohne Werkzeuge fortgeschrittene wissenschaftliche Argumentation, indem sie eine Genauigkeit von 87,7% auf diesem Benchmark erreichte. O4-Mini folgt direkt dahinter mit 81,4%.

- MMMU (massives multimodales Multitasking -Verständnis): O3 hat sich in diesem Benchmark hervorgetan und zeigt seine Fähigkeit, verschiedene und komplexe Aufgaben mit textuellen und visuellen Daten zu erledigen.

- Die letzte Prüfung der Menschheit: Bei dieser Benchmark, die das Denken auf Expertenebene in verschiedenen Bereichen bewertete, erreichte O3 eine Genauigkeit von 26,6%, die alle anderen OpenAI-Modelle übertrifft. Inzwischen übertrifft O4-Mini seinen Vorgänger O3-Mini signifikant.
Anwendungen von O3 und O4-Mini
Das erweiterte Argumentation, die Verwendung von Werkzeugen und die visuellen Funktionen von O3 und O4-Mini entsperren eine breite Palette potenzieller Anwendungen, darunter:
- Komplexe Datenanalyse und Berichterstattung: Analyse von Datensätzen durch Schreiben und Ausführen von Python -Code, Abholung von zusätzlichen Informationen aus dem Net und Generieren von Zusammenfassungen oder Visualisierungen.
- Fortgeschrittene wissenschaftliche Forschung: Unterstützung von Forschern, indem sie komplexe Diagramme interpretieren, experimentelle Daten analysieren, Literatur suchen und möglicherweise neue Anfragen wenden.
- Anspruchsvolles Coding & Software program Engineering: Debugging komplexer Code, generierende Code basierend auf visuellen Mockups oder Diagrammen, Verständnis von Repository-Strukturen und Durchführung von Aufgaben mit mehrstufiger Softwareentwicklung.
- Bildung und Nachhilfe: Erklären Sie komplexe STEM-Konzepte unter Verwendung schrittweise Argumentation, Interpretation von Lehrbuchdiagrammen oder handgeschriebenen Notizen und Bereitstellung einer interaktiven Unterstützung bei der Problemlösung.
- Erstellung und Verständnis für multimodale Inhalte: Erstellen detaillierter Beschreibungen oder Analysen von Bildern, Erstellen von Inhalten, die das Integrieren von Textual content und visuellen Elementen erfordern und Fragen basierend auf visuellen Beweisen beantworten müssen.
- Enterprise Intelligence & Strategie: Analyse von Markttrends mithilfe von Echtzeit-Webdaten, Entwicklung von Prognosen und Erstellung strategischer Pläne auf der Grundlage integrierter Informationsquellen.
- Kreative Problemlösung: Bekämpfung offener Herausforderungen, die die Kombination verschiedener Arten von Informations- und Argumentationsschritten erfordern.
Abschluss
Die O3- und O4-Mini-Modelle von OpenAI stellen einen signifikanten Fortschritt der KI-Fähigkeiten dar, insbesondere in Bezug auf Argumentation und multimodales Verständnis. Durch die Integration von tiefen Argumentation mit vielseitigem agentischen Werkzeuggebrauch und der neuartigen Fähigkeit, mit Bildern zu denken, setzen diese Modelle einen neuen Commonplace für AI -Intelligenz und Nutzen. Ihre beeindruckende Leistung in einer Vielzahl von Benchmarks unterstreicht ihr Potenzial, komplexe, reale Aufgaben in Bereichen in Angriff zu nehmen, von der Software program-Engineering bis zur wissenschaftlichen Forschung.
Während O3 die höchste Leistung für die anspruchsvollsten Aufgaben bietet, bietet O4-Mini eine überzeugende Mischung aus Fähigkeit, Geschwindigkeit und Kosteneffizienz. Beide Modelle teilen jedoch die gleichen agenten- und autonomen Fähigkeiten, die zeigen, wie fortgeschrittene KI geworden ist. Während sich die KI weiterentwickelt, werden solche innovativen Modelle den Weg für ausgefeiltere und vielseitigere Anwendungen ebnen und uns dem Erreichen von AGI näher bringen.
Häufig gestellte Fragen
A. O3 ist das fortschrittlichste Argumentationsmodell von Openai für tiefe Analyseaufgaben. In der Zwischenzeit ist O4-Mini eine leichtere, schnellere Variante von O3, die für Geschwindigkeit und Effizienz optimiert ist, insbesondere bei Mathematik, Codierung und visuellen Aufgaben.
A. O3 verwendet 10x mehr Pc als O1 und führt erweiterte Argumentationsfähigkeiten ein, einschließlich der Fähigkeit, „mit Bildern zu denken“. Es kann Visuals analysieren, Instruments agalisch verwenden und komplexe, mehrstufige Probleme weitaus genauer als O1 lösen.
A. O4-Mini ist schneller, intelligenter und deutlich fähiger als O3-Mini. Es zeichnet sich in Mathematik, Codierung und visuellem Denken aus und unterstützt auch die Verwendung von Instruments. Darüber hinaus übertreffen seine Benchmark-Ergebnisse nicht nur O3-Mini, sondern auch mehrere konkurrierende Modelle.
A. Ja, beide Modelle unterstützen multimodale Argumentation. Sie können komplexe Bilder wie Diagramme, verschwommene Bilder und Whiteboard-Skizzen interpretieren und diese Eingabe als Teil ihres Problemlösungsprozesses verwenden.
A. Sie können sie über die Chatgpt -App oder die Webplattform mit einem Plus-, Professional -oder -Crew -Abonnement verwenden. Sie sind auch über die OpenAI -API für Entwickler und Unternehmen erhältlich.
A. Die Anwendungen von O3 und O4-Mini reichen von Geschäftsstrategie und Datenanalyse bis hin zu Bildung und wissenschaftlicher Forschung. Auf Unternehmensebene können sie bei der Analyse der Organisationsdiagramm für Crew-Erkenntnisse und bildbasierte Produktentdeckungen helfen.
Melden Sie sich an, um weiter zu lesen und Experten-Kuratinhalte zu genießen.