Von Eric Herzog, CMO bei Unendlich
Generative KI (GenAI) hat einen unerwarteten „Companion“ in einer Artwork von Informationstechnologie gefunden, die CIOs für KI tendenziell nicht priorisieren – Unternehmensspeicher. Da Daten für die Aktivierung und Steuerung von GenAI von zentraler Bedeutung sind, hat die Speicherinfrastruktur, in der alle Daten eines Unternehmens gespeichert sind, eine neue Rolle als Grundlage für die Retrieval-Augmented Era (RAG) übernommen.
RAG ist für jedes Unternehmen von großer Bedeutung, das GenAI für individuelle Antworten auf Anfragen nutzen möchte. RAG ist ein GenAI-zentriertes Framework zur Erweiterung, Verfeinerung und Optimierung der Ausgabe von KI-Modellen wie Massive Language Fashions (LLMs) und Small Language Fashions (SLMs).
Das müssen Sie wissen: RAG ist eine auf der Speicherinfrastruktur basierende Architektur zur Verbesserung der Genauigkeit von KI. Damit können Unternehmen sicherstellen, dass die Antworten von KI-Modellen related, aktuell und im richtigen Kontext bleiben. Mit ihren leistungsstarken, generativen KI-Funktionen unterstützen KI-Modelle intelligente Chatbots und andere Anwendungen zur Verarbeitung natürlicher Sprache, die zur Beantwortung von Benutzerfragen durch Querverweise auf maßgebliche Informationsquellen verwendet werden.
Viele KI-Modelle werden zunächst auf extrem großen Datensätzen trainiert, die normalerweise öffentlich verfügbar sind. Um jedoch Antworten auf Kundenfragen sehr spezifisch und kontextuell korrekt für Ihr Unternehmen zu machen, leitet RAG ein KI-Modell (z. B. LLM) um, um personal und proprietäre Daten aus den Datenbanken eines Unternehmens abzurufen. Dies ist der Schlüssel zur Genauigkeit der KI, da sie maßgebliche, vorab festgelegte interne Wissensquellen nutzt – und das alles, ohne dass das KI-Modell neu trainiert werden muss, was ressourcenintensiv ist.
CIOs und Unternehmensleiter, die GenAI-Projekte betreuen, können aufatmen. Dank dieser neuen Möglichkeit, den Nutzen der Unternehmensspeicherinfrastruktur zu erweitern, um die KI genauer zu machen, können Unternehmen nun kostengünstig eine Informationsabrufkomponente zu GenAI-Bereitstellungen hinzufügen und sich auf ihre internen Datensätze verlassen, um ihr Unternehmen keinen öffentlichen Ungenauigkeiten auszusetzen . Als Teil einer transformativen Anstrengung, das eigene Unternehmen in die KI-gestützte Zukunft zu führen, ist es eine Gelegenheit, die intelligente Automatisierung mit RAG zu nutzen, um bessere, genauere und zeitnahe Reaktionen zu erzielen.
Keine spezielle Ausrüstung erforderlich
Eine der guten Nachrichten einer RAG-Workflow-Bereitstellungsarchitektur ist die Tatsache, dass keine spezielle Ausrüstung erforderlich ist. Bestehende Enterprise-Speichersysteme wie die InfiniBox® und die InfiniBox™ SSA können zur Implementierung von RAG für diese Mehrwertkomponente zur Rationalisierung und Verfeinerung des Prozesses verwendet werden, um GenAI genauer und relevanter zu machen.
RAG verleiht dem Geschäftswert von Unternehmensspeichern eine völlig neue Dimension und erhöht die Erfolgsraten von GenAI in unternehmensgroßen Organisationen. Dazu gehört die Nutzung von Unternehmensspeicher, den CIOs bei der Erstellung eines KI-Modell-Ökosystems nutzen können, das mit RAG optimiert ist. Es wird zum „Should-have“.
Um RAG optimum nutzen zu können, benötigen Sie die höchste Leistung Ihrer Speicher-Arrays sowie eine SLA-gestützte 100-prozentige Verfügbarkeit. Noch nie warfare eine 100-prozentige Verfügbarkeit von Unternehmensspeichern so geschäftskritisch wie heute in einer von GenAI geprägten Welt. Es ist auch sinnvoll, Ihrer Dateninfrastruktur Cyber-Storage-Resilienzfunktionen hinzuzufügen, um die Cyber-Wiederherstellung von Daten sicherzustellen, die für GenAI-Anwendungen von wesentlicher Bedeutung ist.
Unabhängig davon, ob sich die Daten alle in einem Rechenzentrum oder in einer hybriden Multi-Cloud-Konfiguration befinden, funktioniert eine RAG-Workflow-Bereitstellungsarchitektur. Eine Cloud-Version einer Speicherlösung der Enterprise-Klasse lässt sich nahtlos in die Cloud integrieren und vereinfacht und beschleunigt die Einführung von RAG für Unternehmen. Dies ergänzt die Arbeit, die Hyperscaler leisten, um KI-Modelle in größerem Maßstab zu entwickeln, um das anfängliche Coaching der KI-Modelle durchzuführen.
Warum ist RAG für GenAI so wichtig?
Selbst wenn die anfängliche Trainingsphase sehr intestine verläuft, stellen KI-Modelle Unternehmen weiterhin vor Herausforderungen. Auch sie können häufig „KI-Halluzinationen“ hervorrufen, bei denen es sich im Grunde um ungenaue oder irreführende Ergebnisse eines GenAI-Modells handelt. Wenn es nicht über die benötigten Informationen verfügt, erfindet ein KI-Modell die Antwort, um einfach eine Antwort zu haben, selbst wenn diese Antwort auf falschen Informationen basiert. Dies hat das Vertrauen der Menschen in die frühen Einsätze von GenAI untergraben.
KI-Modelle neigen aufgrund der Unklarheit über die Terminologie dazu, ungenaue Antworten zu liefern. Sie können auch veraltete Informationen oder eine Antwort von einer nicht maßgeblichen Quelle liefern. Die Folge ist, dass der Kunde eines Unternehmens völlig falsche Informationen erhalten könnte, ohne es zu wissen. Was für eine „Datenkatastrophe“ das ist!
RAG geht diese Herausforderungen direkt an. Es ist eine zuverlässige Methode, um die „KI-Halluzinationen“ zu beseitigen und fundiertere Antworten auf Anfragen über eine GenAI-Anwendung für Unternehmen sicherzustellen. Das KI-Lernmodell nutzt die neuen Erkenntnisse aus dem RAG-Workflow sowie dessen Trainingsdaten, um deutlich bessere Antworten zu erstellen. Dadurch wird das Vertrauen der Menschen in GenAI gestärkt.
Wichtige Erkenntnisse
Mit der RAG-Architektur ist Unternehmensspeicher nun ein wesentliches Aspect in der GenAI-Bereitstellungsstrategie. Verwenden Sie es, um eine RAG-Pipeline kontinuierlich mit neuen, aktuellen Daten zu verfeinern und die Genauigkeit von KI-Modellen zu verbessern.
Denken Sie daran, die proprietären Datensätze Ihres Unternehmens, die in Ihren Datenbanken gespeichert sind, nicht zu wenig zu nutzen. Sie müssen die Punkte zwischen GenAI und Ihrer Dateninfrastruktur verbinden. Der Enterprise-Storage-basierte RAG-Ansatz hilft Ihnen dabei.
Um Ihre Speichersysteme für diese Erweiterung zu optimieren, achten Sie auf branchenführende Leistung, 100 % Verfügbarkeit und Cyber-Storage-Resilienz. Sie machen Sie RAG-ready.
Metaphorisch gesehen ist RAG wie das „neue Öl“, um die GenAI-Engine mit vertrauenswürdigen Daten auf einer ständig verfügbaren Dateninfrastruktur besser laufen zu lassen.
Über Eric Herzog
Eric Herzog ist Chief Advertising and marketing Officer bei Unendlich. Bevor er zu Infinidat kam, warfare Herzog CMO und VP of International Storage Channels bei IBM Storage Options. Zu seinen Führungserfahrungen zählen außerdem: CMO und Senior VP of Alliances für den All-Flash-Speicheranbieter Violin Reminiscence sowie Senior Vice President für Produktmanagement und Produktmarketing für die Enterprise & Mid-Vary Techniques Division von EMC.