OpenAI battle ein führender Lösungsanbieter im Genai -Raum. Aus dem legendären Chatgpt Zu SoraEs ist eine Anlaufstelle für alle Berufstätigen da draußen. Mit Qwen Und Claude OpenAI wird mit seinen neuesten Updates wieder an Popularität gewonnen und befähigt Entwickler, zuverlässigere und fähigere KI -Agenten zu schaffen. Der Haupthighlights Enthält aus der Liste die Antworten API und Agenten SDK. In diesem Weblog werden wir die Antworten API und Agenten SDK untersuchen, verstehen, wie man auf sie zugreift, und lernen, wie man sie verwendet, um reale Anwendungen zu erstellen!
Was ist die Antworten -API?
Die Antworten API ist OpenAIs neueste API zur Vereinfachung des Aufbaus von AI-basierten Anwendungen. Es kombiniert die Einfachheit der Chat-API-API mit den leistungsstarken Werkzeugen der Assistenten-API. Dies bedeutet, dass Entwickler jetzt Agenten erstellen können, die mehrere Instruments nutzen und komplexe, mehrstufige Aufgaben effizienter erledigen. Diese API reduzierte die Abhängigkeit von komplexen schnellen Engineering- und externen Integrationen.
Schlüsselmerkmale der Antworten -API
- Integrierte Instruments wie Websuche, Dateisuche und Pc verwenden, damit Agenten mit realen Daten interagieren.
- Einheitliches Design, das den Polymorphismus vereinfacht und die Benutzerfreundlichkeit verbessert.
- Bessere Beobachtbarkeit und dabei, Entwicklern das Verhalten des Agenten zu verfolgen und Workflows zu optimieren.
- Keine zusätzlichen Kosten, da sie auf der Grundlage der Token -Nutzung bei OpenAIs Standardpreisen berechnet werden.
Mit diesen Instruments ist die Antworten -API ein Spielveränderer zum Aufbau von KI -Agenten. In Zukunft wird die Antworten API alle neuen und kommenden Modelle von OpenAI unterstützen. Mal sehen, wie wir damit Anwendungen erstellen können.
Wie benutze ich Antworten API?
Um Antworten API auszuprobieren:
- Installieren Sie OpenAI (falls bereits installiert) und verwenden Sie OpenAI.
- Stellen Sie sicher, dass Sie über die neueste OpenAI -Bibliothek verfügen (PIP Set up Set up OpenAI –Improve).
- Importieren Sie Openai und richten Sie den Kunden ein.
Nach der Einrichtung können Sie die Antworten -API anfordern. Während grundlegende API-Aufrufe üblich sind, machen die integrierten Fähigkeiten es leistungsfähig. Erkunden wir drei wichtige Funktionen:
- Dateisuche: Erkenntnisse aus Dokumenten abrufen.
- Websuche: Erhalten Sie in Echtzeit, zitierte Informationen.
- Computergebrauch: Automatisieren Sie Systeminteraktionen.
Jetzt sehen wir sie in Aktion!
1. Dateisuche
Es ermöglicht Modelle, Informationen in einer Wissensbasis zuvor hochgeladener Dateien über semantische und Schlüsselwortsuche abzurufen. Derzeit unterstützt es keine CSV -Dateien. Sie können die Liste der unterstützten Dateitypen überprüfen Hier.
HINWEIS: Stellen Sie vor Verwendung der Dateisuche Ihre Dateien in einer Vektor -Datenbank auf
Aufgabe: Namen von Personen mit Area als Datenwissenschaft. (Ich habe Folgendes verwendet Datei.))
Code:
response = consumer.responses.create(
mannequin="gpt-4o-mini",
enter="Names of individuals with area as Information Science",
instruments=({
"kind": "file_search",
"vector_store_ids": (vector_store_id),
"filters": {
"kind": "eq",
"key": "Area",
"worth": "Information Science"
}
})
)
print(response.output_text)
Ausgabe:
The individual with the area of Information Science is Alice Johnson (0).
(0) names_and_domains.pdf
2. Websuche
Mit dieser Funktion können Modelle das Net nach den neuesten Informationen durchsuchen, bevor sie eine Antwort generieren, damit die Daten auf dem neuesten Stand sind. Das Modell kann auswählen, ob Sie das Net suchen oder nicht basierend auf dem Inhalt der Eingabeaufforderung.
Aufgabe: Was sind die besten Cafés in Vijay Nagar?
Code:
response = consumer.responses.create(
mannequin="gpt-4o",
instruments=({
"kind": "web_search_preview",
"user_location": {
"kind": "approximate",
"nation": "IN",
"metropolis": "Indore",
"area": "Madhya Pradesh",
}
}),
enter="What are the most effective cafe in Vijay nagar?",
)
print(response.output_text)
Ausgabe:

3. Computergebrauch
Es handelt sich um eine praktische Anwendung des CUA-Modells (Pc-Use-Use-Brokers), das die Sichtfunktionen von GPT-4O mit erweitertem Argument kombiniert, um die steuerbaren Computeroberflächen zu simulieren und Aufgaben auszuführen.
Aufgabe: Überprüfen Sie den neuesten Weblog auf der Analytics Vidhya -Web site.
Code:
response = consumer.responses.create(
mannequin="computer-use-preview",
instruments=({
"kind": "computer_use_preview",
"display_width": 1024,
"display_height": 768,
"atmosphere": "browser" # different doable values: "mac", "home windows", "ubuntu"
}),
enter=(
{
"position": "consumer",
"content material": "Verify the newest weblog on Analytics Vidhya web site."
}
),
truncation="auto"
)
print(response.output)
Ausgabe:
ResponseComputerToolCall(id='cu_67d147af346c8192b78719dd0e22856964fbb87c6a42e96',
motion=ActionScreenshot(kind="screenshot"),
call_id='call_a0w16G1BNEk09aYIV25vdkxY', pending_safety_checks=(),
standing="accomplished", kind="computer_call")
Wie unterscheidet sich die Antworten -API von der API der Abschlüsse?
Jetzt, da wir gesehen haben, wie die API der Antworten funktioniert, lassen Sie uns sehen, wie unterschiedlich sie von der bereits vorhandenen API von Fertigstellungen ist.
Antworten API vs Abschlüsse API: Ausführung
API | Antworten API | Fertigstellungen API |
Code |
from openai import OpenAI consumer = OpenAI() response = consumer.responses.create( mannequin="gpt-4o", inputs=( { "position": "consumer", "content material": "Write a one-sentence bedtime story a couple of unicorn." } ) ) print(response.output_text) |
from openai import OpenAI consumer = OpenAI() completion = consumer.chat.completions.create( mannequin="gpt-4o", messages=( { "position": "consumer", "content material": "Write a one-sentence bedtime story a couple of unicorn." } ) ) print(completion.decisions(0).message.content material) |
Ausgabe |
![]() |
![]() |
Antworten API gegen Abschlüsse API: Funktionen
Hier finden Sie eine vereinfachte Aufschlüsselung der verschiedenen Funktionen der API und der API der Chat -Komplerionen und der Antworten:
Fähigkeiten | Antworten API | CHAT -Abschlüsse API |
Textgenerierung | ✅ | ✅ |
Audio | Bald kommen | ✅ |
Imaginative and prescient | ✅ | ✅ |
Websuche | ✅ | ✅ |
Dateisuche | ✅ | ❌ |
Computergebrauch | ✅ | ❌ |
Code -Interpreter | Bald kommen | ❌ |
Antworthandhabung | Gibt einen einzelnen strukturierten Ausgang zurück | Gibt das Auswahlarray zurück |
Gesprächszustand | PROBOR_REPRESONE_ID für Kontinuität | Muss manuell verwaltet werden |
Speicherverhalten | Standardmäßig gespeichert (Speicher: Falsch zu Deaktivieren) | Standardmäßig gespeichert |
Roadmap: Was wird fortgesetzt, was wird sich verabreicht?
Wenn Antworten dwell dwell gehen, lautet die brennende Frage nun, würde sie die vorhandenen Chat -Abschlüsse und die Assistenten -API beeinflussen? Ja, das würde. Schauen wir uns an, wie:
- CHAT -Abschlüsse API: OpenAI wird es weiterhin mit neuen Modellen aktualisieren, aber nur, wenn die Funktionen keine integrierten Instruments erfordern.
- Net -Search & Datei -Suchwerkzeuge: Diese werden in der API der Antworten raffinierter und mächtiger.
- Assistenten API: Die Antworten -API enthält ihre besten Funktionen und verbessert die Leistung. OpenAI hat angekündigt, dass eine vollständige Parität in Kürze erfolgt und die Assistenten-API Mitte 2026 veraltet sein wird.
Einführung der Agenten SDK
Beim Aufbau von AI -Agenten geht es nicht nur darum, eine leistungsstarke API zu haben, sondern eine effiziente Orchestrierung. Hier kommt Openais Brokers SDK ins Spiel. Das Agenten SDK ist ein Open-Supply-Toolkit, das Agenten-Workflows vereinfacht. Dieses Rahmenwerk für Agent -Erstellung integriert nahtlos in die API der Antworten API und Chat -API. Darüber hinaus ist es auch mit Modellen verschiedener Anbieter kompatibel, vorausgesetzt, sie bieten einen API -Endpunkt an, der wie Chat -Fertigstellungen gestaltet ist.
Einige der wichtigsten Merkmale von Agenten SDK sind:
- Es ermöglicht Entwicklern, KI-Agenten mit integrierten Instruments zu konfigurieren.
- Es ermöglicht eine orchestrierte Multi-Agent, sodass nach Bedarf eine nahtlose Koordination verschiedener Wirkstoffe ermöglicht.
- Es ermöglicht uns, die Konversation und den Informationsfluss zwischen unseren Agenten zu verfolgen.
- Es ermöglicht eine einfachere Möglichkeit, Leitplanken für Sicherheit und Einhaltung aufzutragen.
- Es stellt sicher, dass Entwickler die Agentenleistung mit integrierten Observierbarkeitstools überwachen und optimieren können.
Agent SDK ist kein „Neuzugang“, um die Juwelen von AI zu öffnen. Es ist eine verbesserte Model von „Swarm“, dem experimentellen SDK, das Open AI letztes Jahr veröffentlicht hatte. Während „Swarm“ gerade zu Bildungszwecken veröffentlicht wurde, wurde es bei Entwicklern populär und wurde auch von mehreren Unternehmen übernommen. Um mehr Unternehmen zu bedienen und ihnen zu helfen, die Agenten SDK nahtlos auf Produktionsgrad-Agenten aufzubauen, wurde die Agenten veröffentlicht. Nachdem wir wissen, welche Agenten SDK zu bieten haben, lassen Sie uns sehen, wie wir dieses Rahmen verwenden können, um unser Agentensystem aufzubauen.
Lesen Sie auch: High 10 generative KI -Codierungsweiterungen im VS -Code
Erstellen Sie ein multiagentisches System mit Agent SDK
Wir werden ein Multi-Agent-System erstellen, das den Benutzern bei Autoempfehlungen und Wiederverkaufspreisschätzung hilft, indem wir LLM-Betroffenen und Net-Such-Instruments nutzen, um genaue und aktuelle Erkenntnisse zu liefern.
Schritt 1: Erstellen eines einfachen KI -Agenten
Wir erstellen mit der Erstellung eines CAR -Advisor -Agenten, der den Benutzern hilft, einen geeigneten Auto -Typ aus ihren Bedürfnissen auszuwählen.
Code:
car_advisor = Agent(
title="Automotive advisor",
directions= "You might be an skilled in advising appropriate automotive kind like sedan, hatchback and so on to folks based mostly on their necessities.",
mannequin="gpt-4o",
)
immediate = "I'm searching for a automotive that I get pleasure from driving and comforatbly take 4 folks. I aircraft to journey to hills. What kind of automotive ought to I purchase?"
async def important():
outcome = await Runner.run(car_advisor, immediate)
print(outcome.final_output)
# Run the operate in Jupyter
await important()
Ausgabe:

Schritt 2: Erstellen Sie das Multi-Agent-System
Mit dem Grundagenten erstellen wir jetzt ein Multi-Agent-System, das verschiedene KI-Agenten enthält, die auf ihre jeweiligen Bereiche spezialisiert sind. So funktioniert es:
Agenten im Multi-Agent-System
- Autoverkaufsvorschätzung Agent: Es bietet einen Wiederverkaufspreisschätzung, der auf Autodetails basiert.
- CAR MODEL Advisor Agent: Es schlägt geeignete Automodelle auf der Grundlage von Price range und Standort vor.
- Triage Agent: Es wird die Abfrage an den entsprechenden Agenten angelegt.
Wir werden den Agenten zwei verschiedene Eingabeaufforderungen zur Verfügung stellen und ihre Ergebnisse beobachten.
Code:
car_sell_estimate = Agent(
title="Automotive promote estimate",
directions= "You might be an skilled in suggesting an appropriate value of reselling a automotive based mostly on its make, mannequin, 12 months of buy, and situation.",
handoff_description= "Automotive reselling value estimate skilled",
mannequin="gpt-4o",
instruments=(WebSearchTool())
)
car_model_advisor = Agent(
title="Automotive mannequin advisor",
directions= "You might be an skilled in advising appropriate automotive mannequin to folks based mostly on their finances and placement.",
handoff_description= "Automotive mannequin advice skilled",
mannequin="gpt-4o",
instruments=(WebSearchTool())
)
triage_agent = Agent(
title = "Triage Agent",
directions="You establish the suitable agent for the duty.",
mannequin = "gpt-4o",
handoffs=(car_sell_estimate, car_model_advisor)
)
Immediate 1:
immediate = "I need to promote my Ecosport automotive in New Delhi. It's 3 years outdated and in good situation. 50000Km. What value ought to I count on?"
async def important():
outcome = await Runner.run(triage_agent, immediate)
print(outcome.final_output)
# Run the operate in Jupyter
await important()
Ausgabe 1:

Eingabeaufforderung 2:
immediate = "I need to purchase a excessive acceleration automotive, comfy for 4 folks for 20 lakhs in New Delhi. Which automotive ought to I purchase?"
async def important():
outcome = await Runner.run(triage_agent, immediate)
print(outcome.final_output)
# Run the operate in Jupyter
await important()
Ausgabe 2:

Wir haben die Autooptionen gemäß unseren Anforderungen erhalten! Die Implementierung battle einfach und schnell. Sie können diesen Agentenrahmen verwenden, um Agenten für Reiseunterstützung, Finanzplanung, medizinische Unterstützung, personalisierte Einkäufe, automatisierte Forschung und vieles mehr aufzubauen.
SDK des Agenten: Ein neuer Agentenrahmen in der Stadt?
OpenAIs Agenten SDK repräsentieren seinen strategischen Vorstoß, einen speziellen Rahmen für die Entwicklung von AI -Agenten zu schaffen. Das Rahmen umfasst die Besatzungsmerkmale von Crew-ähnlichen Merkmalen durch den Triage-Agenten, der die Funktionen der Crew AI nachahmte. In ähnlicher Weise ähneln seine Handoff -Mechanismen den von Autogen stark und ermöglichen eine effiziente Delegation von Aufgaben zwischen mehreren Wirkstoffen.
Darüber hinaus spiegelt sich die Stärke von Langchain in der modularen Wirkstofforchestrierung in der Artwork und Weise wider, wie die Agenten SDK strukturierte Workflows liefert und eine reibungslose Ausführung und Anpassungsfähigkeit gewährleisten. Während Brokers SDK nichts anderes bietet als das, was die vorhandenen Frameworks bereits tun, wird es ihnen bald einen harten Wettbewerb verleihen.
Lesen Sie auch: Claude 3.7 Sonett: Das bisher beste Codierungsmodell?
Warum brauchen Entwickler Antworten API & Agenten SDK?
Antworten API und Agenten SDK bieten Entwicklern die Instruments und Plattform, um AI-gesteuerte Anwendungen zu erstellen. Durch die Reduzierung des Vertrauens in die manuelle Eingabeaufforderung und umfangreiche benutzerdefinierte Logik ermöglichen diese Instruments Entwicklern, sich auf die Erstellung intelligenter Workflows mit minimaler Reibung zu konzentrieren.
- Einfache Integration: Entwickler müssen nicht mehr mehrere APIs für verschiedene Instruments jonglieren. Die Antworten API konsolidiert die Websuche, die Dateisuche und den Pc in einer einzigen Schnittstelle.
- Bessere Beobachtbarkeit: Mit integrierten Überwachungs- und Debugging-Instruments können Entwickler die Leistung der Agenten einfacher optimieren.
- Skalierbarkeit: Die Agenten SDK bietet einen strukturierten Ansatz zur Behandlung von Workflows mit mehreren Agenten und ermöglicht eine robustere Automatisierung.
- Verbesserte Entwicklungszyklen: Durch die Beseitigung der Notwendigkeit einer umfassenden Iteration und externen Software-Integration können Entwickler viel schneller prototypisieren und bereitstellen.
Abschluss
Die Einführung der Antworten von OpenAI und Agenten SDK ist ein Sport-Changer für eine AI-gesteuerte Automatisierung. Durch die Nutzung dieser Instruments haben wir ein Multi-Agent-System sehr schnell mit nur wenigen Codezeilen erfolgreich erstellt. Diese Implementierung kann weiter erweitert werden, um zusätzliche Instruments, Integrationen und Agentenfunktionen zu umfassen und den Weg für intelligentere und autonomere KI -Anwendungen in verschiedenen Branchen zu ebnen.
Diese Instruments helfen sicher, Entwicklern und Unternehmen zu helfen, die Komplexität der Entwicklung zu reduzieren und intelligentere und skalierbare Automatisierungslösungen zu schaffen. Egal, ob es sich um Kundensupport, Forschung, Unternehmensautomatisierung oder branchenspezifische KI-Anwendungen handelt, die Antworten API und Agenten SDK bieten einen leistungsstarken Rahmen für die Aufbau von KI-betriebenen Systemen der nächsten Technology problemlos.
Häufig gestellte Fragen
A. Die Antworten-API ist das neueste AI-Framework von OpenAI, das die Agentenentwicklung durch Integration integrierter Instruments wie Websuche, Dateisuche und Computerverwendung vereinfacht.
A. Im Gegensatz zur API von Fertigstellungen unterstützt die Antworten-API die Integration von Multi-Instruments, strukturierte Ausgaben und ein integriertes Gesprächszustandsmanagement.
A. Die Agenten SDK ist ein Open-Supply-Framework, mit dem Entwickler Multi-Agent-Systeme mit KI-angetanter Automatisierung erstellen und orchestrieren können.
A. Es ermöglicht eine nahtlose Agentenkoordination, verbesserte Beobachtbarkeit, eingebaute Leitplanken und eine verbesserte Leistungsverfolgung.
A. Ja! Die Agenten SDK integriert sich in die Antworten-API, um leistungsstarke AI-gesteuerte Anwendungen zu erstellen.
A. Ja, es kann mit Modellen von Drittanbietern funktionieren, die die API-Integrationen im Chat-Abschluss unterstützen.
A. Branchen wie Vehicle, Finanzen, Gesundheitswesen, Kundenunterstützung und Forschung können mit AI-gesteuerten Agenten zur Optimierung von Betrieb und Entscheidungsfindung verwenden.
Melden Sie sich an, um weiter zu lesen und Experten-Kuratinhalte zu genießen.