Gesponserte Inhalte

DatenorchestrierungDatenorchestrierung

Wenn Unternehmen versuchen, generative KI zu nutzen, stoßen sie häufig auf eine Lücke zwischen ihrem vielversprechenden Potenzial und der Realisierung des tatsächlichen Geschäftswerts. Bei Astronomer haben wir aus erster Hand gesehen, wie die Integration generativer KI (GenAI) in Betriebsprozesse Unternehmen verändern kann. Wir haben aber auch festgestellt, dass der Schlüssel zum Erfolg in der Orchestrierung der wertvollen Unternehmensdaten liegt, die zum Betrieb dieser KI-Modelle erforderlich sind.

Dieser Blogbeitrag beschreibt die entscheidende Rolle der Datenorchestrierung bei der Bereitstellung generativer KI im großen Maßstab. Ich werde reale Kundenanwendungsfälle hervorheben, bei denen Apache Airflow, verwaltet von Astro des Astronomenstruggle maßgeblich an erfolgreichen Bewerbungen beteiligt, bevor wir abschließend die nützlichen nächsten Schritte für den Einstieg erläutern.

Welche Rolle spielt die Datenorchestrierung im GenAI-Stack?

Generative KI-Modelle sind mit ihrem umfangreichen vorab trainierten Wissen und ihrer beeindruckenden Fähigkeit, Inhalte zu generieren, unbestreitbar leistungsstark. Ihr wahrer Wert erschließt sich jedoch erst, wenn sie mit dem institutionellen Wissen kombiniert werden, das in Ihren umfangreichen, proprietären Datensätzen und operativen Datenströmen erfasst ist. Die erfolgreiche Bereitstellung von GenAI umfasst die Orchestrierung von Workflows, die wertvolle Datenquellen aus dem gesamten Unternehmen in die KI-Modelle integrieren und ihre Ergebnisse mit einem relevanten und aktuellen Geschäftskontext untermauern.

Die Integration von Daten in GenAI-Modelle (für Inferenz, Eingabeaufforderungen oder Feinabstimmung) umfasst komplexe, ressourcenintensive Aufgaben, die optimiert und wiederholt ausgeführt werden müssen. Datenorchestrierungstools bieten ein Framework – im Zentrum des entstehenden KI-App-Stacks –, das diese Aufgaben nicht nur vereinfacht, sondern auch die Möglichkeit für Entwicklungsteams verbessert, mit den neuesten Innovationen aus dem KI-Ökosystem zu experimentieren.

Die Orchestrierung von Aufgaben stellt sicher, dass Rechenressourcen effizient genutzt, Arbeitsabläufe in Echtzeit optimiert und angepasst werden und Bereitstellungen stabil und skalierbar sind. Diese Orchestrierungsfunktion ist besonders wertvoll in Umgebungen, in denen generative Modelle häufig aktualisiert oder basierend auf neuen Daten neu trainiert werden müssen oder in denen mehrere Experimente und Versionen gleichzeitig verwaltet werden müssen.

Apache-Luftstrom ist zum Customary für eine solche Datenorchestrierung geworden, die für die Verwaltung komplexer Arbeitsabläufe von entscheidender Bedeutung ist und es Groups ermöglicht, KI-Anwendungen effizient vom Prototyp zur Produktion zu bringen. Wenn es als Teil des verwalteten Dienstes Astro von Astronomer ausgeführt wird, bietet es außerdem Skalierbarkeits- und Zuverlässigkeitsebenen, die für Geschäftsanwendungen von entscheidender Bedeutung sind, sowie eine Governance- und Transparenzebene, die für die Verwaltung von KI- und maschinellen Lernvorgängen unerlässlich ist.

Die folgenden Beispiele veranschaulichen die Rolle der Datenorchestrierung in GenAI-Anwendungen.

Konversations-KI für die Assist-Automatisierung

Eine führende digitale Reiseplattform nutzte bereits Airflow, das von Astro verwaltet wird, um Datenflüsse für ihre Analyse- und Machine-Studying-Pipelines zu verwalten. Um das Potenzial von GenAI im Unternehmen zu steigern, erweiterten die Ingenieure des Unternehmens Astro in ihr neues Reiseplanungstool, das Millionen von Benutzern täglich Reiseziele und Unterkünfte empfiehlt und dabei auf großen Sprachmodellen (LLMs) und Strömen operativer Daten basiert.

Diese Artwork von Konversations-KI, die oft als Chat- oder Voice-Bots verwendet wird, erfordert intestine kuratierte Daten, um Antworten von geringer Qualität zu vermeiden und ein sinnvolles Benutzererlebnis zu gewährleisten. Da das Unternehmen Astro als Customary verwendet, um sowohl seine bestehenden ML-/Betriebspipelines als auch seine GenAI-Pipelines zu orchestrieren, kann das Reiseplanungstool den Benutzern relevantere Empfehlungen unterbreiten und gleichzeitig ein nahtloses Erlebnis vom Durchsuchen bis zur Buchung bieten.

Astronomeneigene Assist-Anwendung, Frag Astronutzt LLMs und Retrieval Augmented Era (RAG), um domänenspezifische Antworten durch die Integration von Wissen aus mehreren Datenquellen zu liefern. Durch die Veröffentlichung Ask Astro als Open-Supply-Projekt Wir zeigen, wie Airflow sowohl die Verwaltung von Datenströmen als auch die Überwachung der KI-Leistung in der Produktion vereinfacht.

Inhaltserstellung

Lorbeerein KI-Unternehmen, das sich auf die Automatisierung der Zeiterfassung und Abrechnung für professionelle Dienstleistungen konzentriert, demonstriert die Leistungsfähigkeit der Inhaltsgenerierung als einen weiteren gängigen Anwendungsfall von GenAI. Das Unternehmen nutzt KI, um aus detaillierten Dokumentationen und Transaktionsdaten Zeitnachweise und Abrechnungszusammenfassungen zu erstellen. Die Verwaltung dieser vorgelagerten Datenflüsse und die Pflege kundenspezifischer Modelle kann komplex sein und erfordert eine robuste Orchestrierung.

Astro dient als zentrale Anlaufstelle für Laurels Daten und verarbeitet enorme Mengen an Benutzerdaten effizient. Durch die Integration von maschinellem Lernen in seine Airflow-Pipelines automatisiert Laurel nicht nur kritische Prozesse für seine Kunden, sondern macht sie buchstäblich doppelt so effizient.

Argumentation und Analyse

Mehrere Supportorganisationen verwenden von Airflow verwaltete KI-Modelle, um Supporttickets umzuleiten. Dadurch wird die Lösungszeit erheblich verkürzt, indem Tickets je nach Fachwissen Agenten zugeordnet werden. Dies zeigt die Anwendung von KI beim Denken, um Geschäftslogik für eine verbesserte Betriebseffizienz bereitzustellen.

Dosueine KI-Plattform für Softwareentwicklungsteams, verwendet eine ähnliche Orchestrierung, um Datenpipelines zu verwalten, die Informationen von Slack, GitHub, Jira usw. aufnehmen und indizieren. Zuverlässige, wartungsfreundliche und überwachbare Datenpipelines sind für die KI-Anwendungen von Dosu von entscheidender Bedeutung, die dabei helfen, Aufgaben für große Softwareprojekte wie LangChain automatisch zu kategorisieren und zuzuweisen.

DatenorchestrierungDatenorchestrierung
Dosus KI-Workflows werden von Airflow orchestriert und laufen in Astro

Optimieren Sie die Anwendungsentwicklung mit KI und Airflow

Große Sprachmodelle helfen auch bei der Codegenerierung und -analyse. Dosu und Astro verwenden LLMs, um Codevorschläge zu generieren bzw. Cloud-IDE-Aufgaben zu verwalten. Diese Anwendungen erfordern eine sorgfältige Datenverwaltung aus Repositories wie GitHub und Jira, um sicherzustellen, dass organisatorische Grenzen eingehalten und vertrauliche Daten anonymisiert werden. Die Orchestrierungsfunktionen von Airflow sorgen für Transparenz und Herkunft und geben Groups Vertrauen in ihre Datenverwaltungsprozesse.

Nächste Schritte zum Einstieg in die Datenorchestrierung

Durch die Nutzung des Workflow-Managements von Airflow und der Bereitstellungs- und Skalierungsfunktionen von Astronomer müssen sich Entwicklungsteams keine Gedanken über die Verwaltung der Infrastruktur und die Komplexität von MLOps machen. Stattdessen können sie sich auf die Datentransformation und Modellentwicklung konzentrieren, was die Bereitstellung von GenAI-Anwendungen beschleunigt und gleichzeitig deren Leistung und Governance verbessert.

Um Ihnen den Einstieg zu erleichtern, haben wir vor kurzem unsere Leitfaden zur Datenorchestrierung für generative KI. Der Leitfaden bietet Ihnen weitere Informationen zu den wichtigsten erforderlichen Funktionen für die Datenorchestrierung sowie ein Cookbook mit Referenzarchitekturen für eine Vielzahl verschiedener Anwendungsfälle generativer KI.

Unsere Groups sind bereit, Workshops mit Ihnen durchzuführen, um zu besprechen, wie Airflow und Astronomer Ihre GenAI-Initiativen beschleunigen können. kontaktiere uns um Ihre Sitzung zu planen.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert