Das Tempo der GenAI-Innovationen rückt transformative Geschäftsmethoden in greifbare Nähe – deckt aber auch Datenlücken auf, die die Risiken und potenziellen Nachteile der KI erhöhen. Während GenAI vielen Unternehmen dabei hilft, ihre betriebliche Effizienz zu steigern, erkennt laut Untersuchungen ein kleinerer Prozentsatz sein Potenzial, die Artwork und Weise zu verändern, wie sie Innovationen und Produkte entwickeln.

Es gibt einige sehr öffentliche Beispiele für die kostspielige oder peinlich Ergebnisse, wenn KI-Projekte scheitern, sind in der Regel mit systemischen Herausforderungen bei der Datenverwaltung verbunden. Selbst die fortschrittlichsten Organisationen können unter der Unfähigkeit leiden, den Modellen die „richtigen“ Daten bereitzustellen nach Den Forschern von RAND zufolge fehlt vielen die notwendige Infrastruktur, um mit Daten zu arbeiten und sie zu verwalten.

Um das Potenzial von KI auszuschöpfen, müssen Maschinenmodelle mit einem großen und zuverlässigen Datenvorrat versorgt werden, der von ausreichender Qualität ist und verwaltet und gesteuert werden kann. Zu viele Fashions werden schlecht ernährt, weshalb das Sprichwort „Müll rein, Müll raus“ aktueller denn je ist.
Datenexperten arbeiten mit Praktiken und Verfahren, die älter als KI sind, und haben Schwierigkeiten, diese Anforderungen zu erfüllen. Wie additionally sollten sich Datenprofis am besten für den KI-Wettbewerb rüsten? Der erste Schritt besteht darin, zu erkennen, dass das Downside besteht. Hier sind drei Frühindikatoren:

  • Starke Abhängigkeit von der manuellen Datenverwaltung. Hier krempeln Ingenieure die Ärmel hoch, um Datenpipelines aufzubauen und zu warten, Daten zu standardisieren und zu klassifizieren sowie Probleme zu finden und zu beheben. Es ist zeitaufwändig, ineffizient und unzuverlässig – und keine zusätzlichen Personalressourcen werden das Downside lösen.
  • Mangelnde Datentransparenz. Die meisten Daten, die durch Organisationen fließen, sind dunkel – es fehlen Particulars über Eigentümer, Quelle oder wer sie geändert hat. Dies birgt ein erhebliches Risiko, dass möglicherweise unvollständige oder unangemessene Daten in Modelle eingespeist werden und möglicherweise gegen geistige Eigentums- und Datenschutzvorschriften verstoßen wird. Außerdem wird es schwierig, die Verantwortung für die Einhaltung gesetzlicher Vorschriften zu übernehmen.
  • Daten können nicht als sichere, zuverlässige oder wiederverwendbare Unternehmenswerte genutzt werden. Dies kann sich auf verschiedene Weise äußern, aber zu den Frühindikatoren gehören: Schwierigkeiten, Daten konsistent oder wiederholbar zu finden, was die Projektkosten in die Höhe treibt und die Umsetzung verlangsamt; Schwierigkeiten bei der Festlegung und Durchsetzung von Regeln für die Nutzung und den Schutz von Daten, wodurch Regulierungs- und Compliance-Lücken entstehen; und die Unfähigkeit, Daten nach Priorität und Wert zu verwalten oder zu verschieben, was zu höheren Speicher- und Infrastrukturkosten führt.

Wenn Ihnen das bekannt vorkommt, gibt es eine bewährte Vorgehensweise in drei Schritten, um Daten match für die KI zu machen.

Erstens: Eliminieren Sie in jeder Part den mit der Datenaufbereitung verbundenen Mehraufwand. Das bedeutet, die Automatisierung zu nutzen und eine Umgebung aufzubauen, die in der Lage ist, sowohl auf unstrukturierte als auch strukturierte Daten zuzugreifen, sie zu entdecken, zu klassifizieren und ihre Qualität zu testen, unabhängig von ihrem Speicherort oder Format. Stellen Sie Instruments und Techniken bereit, die die Bereitstellung beschleunigen und optimieren, z. B. Pipeline-Vorlagen, unabhängig von der Größe der Computerumgebung.

Als nächstes: Einblick und Kontrolle schaffen. Klassifizieren und kennzeichnen Sie Daten automatisch an der Quelle und verwenden Sie dabei unternehmensrelevante Terminologie, die den Daten bei ihrer Weiterleitung durch Projekte folgt. Nutzen Sie einen Katalog, der in der Lage ist, diese Informationen zu verstehen und darauf zu reagieren – die Herkunft der Daten und ihren Weg zu erfassen und gleichzeitig Regeln für den Zugriff und den Schutz auf Metadatenebene festzulegen und umzusetzen. Ein Katalog dieses Kalibers bringt Wissen und Leistungsfähigkeit mit sich – er macht hochwertige Daten leicht zugänglich, rationalisiert Projekte und stellt sicher, dass sie gemäß den Richtlinien und Regeln für Sicherheit und Governance verantwortungsvoll genutzt werden.

Schließlich geht es um eine effiziente Datenbereitstellung. Vergessen Sie die manuellen Prozesse, die im großen Maßstab fehleranfällig sein können, die Arbeitsbelastung der Ingenieure erhöhen und zu Daten von schlechter Qualität führen. Durch die Automatisierung werden Ressourcen freigesetzt und die Voraussetzungen für die konsistente Bereitstellung KI-fähiger Daten geschaffen. Gleichzeitig werden IT-Groups Integrationsprobleme erspart und technische Schulden vermieden.

GenAI hat sich als Visitenkarte der modernen KI erwiesen. Aber um Pilotprojekte und Bereitstellungsbereiche in bahnbrechende Ergebnisse umzuwandeln, müssen solide Grundlagen für Datenzugriff, Datenqualität, Datenverfügbarkeit, Datenbereitstellung und Governance geschaffen werden. Dadurch wird der Grundstein für eine unternehmensweite Datenfitness auf KI-Niveau gelegt.

Über den Autor

Kunju Kashalikar, Senior Director für Produktmanagement bei Pentaho. Kunju ist eine Führungspersönlichkeit mit umfassender Experience in den Bereichen Produktentwicklung, Datenmanagement und KI/ML-Technologien. Er verfügt über eine nachgewiesene Erfolgsbilanz bei der Bereitstellung von Produkten und Lösungen in der Hybrid Cloud in den Bereichen Datenmanagement und Edge und nutzt dabei Design Considering. Er ist Leiter des Produktmanagements auf der Pentaho-Plattform.

Melden Sie sich für die kostenlosen insideAI-Information an E-newsletter.

Begleiten Sie uns auf Twitter: https://twitter.com/InsideBigData1

Treten Sie uns auf LinkedIn bei: https://www.linkedin.com/firm/insideainews/

Begleiten Sie uns auf Fb: https://www.fb.com/insideAINEWSNOW

Schauen Sie bei uns vorbei YouTube!



Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert