Im heutigen komplexen und sich schnell entwickelnden Geschäftsumfeld spiegelt der Weg von Rohdaten zu umsetzbaren Erkenntnissen die sorgfältige Handwerkskunst eines Meisterhandwerks wider. Stellen Sie sich ein Szenario vor, in dem ein Unternehmen erhebliche Investitionen in einen hochmodernen Knowledge Lake tätigt, mit dem Ziel, ein flexibles, skalierbares Repository für alle seine Datenanforderungen einzurichten. Die Imaginative and prescient besteht darin, Daten aus verschiedenen Quellen – strukturiert und unstrukturiert – an einem einzigen Ort zu zentralisieren und sie für die Analyse leicht verfügbar zu machen. Ohne strenge Governance und durchdachte Kuratierung kann dieser intestine gemeinte Datensee jedoch schnell zu einem chaotischen und unbrauchbaren Sumpf verkommen, in dem Daten nur schwer zu finden, zu analysieren und zu vertrauen sind.

Die Bedeutung dieses Prozesses kann nicht genug betont werden. In der heutigen Wirtschaft, in der Unternehmen zunehmend versuchen, ihre Daten zu monetarisieren, ist der strategische Wert der Datenkuratierung immens. Wenn ein Unternehmen seine Daten im Rahmen seiner Bewertung verbessern möchte – sei es für den internen Gebrauch oder den externen Verkauf – muss es sicherstellen, dass diese Daten nicht nur gesammelt, sondern kuratiert werden. Richtig kuratierte Daten mit klar definierten Bezeichnungen und Attributen sind wertvoller, weil sie einfacher zu analysieren, zuverlässiger und letztendlich umsetzbarer sind. Umgekehrt haben Daten, die lediglich gesammelt, aber nicht organisiert oder angereichert werden, nur einen begrenzten Nutzen und sind für potenzielle Investoren weniger attraktiv.

Der bodenlose Datensee

Dieses Szenario kommt häufiger vor, als man denkt. Viele Unternehmen starten ihre Dateninitiativen mit ehrgeizigen Zielen, werden dann aber von der schieren Menge und Unordnung ihrer Daten überwältigt. Zunächst übernehmen sie eine Warehouse-Mentalität und speichern Daten für die zukünftige Verwendung. Doch mit der Anhäufung von Daten wandeln sie sich von einem Vermögenswert zu einer Belastung. Ohne sorgfältige Bewirtschaftung verwandeln sich diese Seen in Sümpfe, in denen Daten willkürlich und oft doppelt gespeichert werden, was die Speicherung und den Abruf unnötig teuer und langsam macht.

Der Kern des Issues liegt in der irrigen Annahme, dass Daten, sobald sie gespeichert sind, von Natur aus nützlich sein werden. In Wahrheit bleiben Daten ohne ordnungsgemäße Kuratierung weitgehend ungenutzt und werden unterbewertet. So wie ein Museumskurator Artefakte sorgfältig auswählt, organisiert und präsentiert, um ein bedeutungsvolles Erlebnis zu schaffen, muss ein Datenkurator Daten organisieren und verbessern, um sie für die Organisation zugänglich und wertvoll zu machen. Dieser Prozess umfasst mehr als nur das Speichern von Daten. Es erfordert eine bewusste Kennzeichnung, die Erstellung aussagekräftiger Attribute, die Strukturierung der Daten in einer Weise, die mit den strategischen Zielen der Organisation übereinstimmt, und die Bereitstellung der Daten für eine effiziente Speicherung und Abfrage.

Knowledge Governance vs. Datenkuration

Dabei ist die Unterscheidung zwischen Knowledge Governance und Knowledge Curation von entscheidender Bedeutung. Knowledge Governance stellt die wesentliche Grundlage dar – die Festlegung der Regeln, Richtlinien und Verfahren, die bestimmen, wie Daten innerhalb einer Organisation erfasst, gespeichert, abgerufen und genutzt werden. Die Tatsache, dass die Datenverwaltung diese Ziele nicht erreicht und dem Fortschritt oft im Wege steht, ist, wenn sie richtig durchgeführt wird, von entscheidender Bedeutung für die Aufrechterhaltung der Datenqualität, die Gewährleistung der Sicherheit und die Erfüllung regulatorischer Anforderungen. Governance allein impliziert jedoch häufig und/oder manifestiert sich in Bürokratie – starren Regeln, die Innovationen behindern können. Die Datenkuratierung hingegen geht über Kontrolle und Aufsicht hinaus. Es geht darum, die Daten zu verbessern, damit produktorientierte Groups schnell experimentieren und dann letztendlich wertvolle Erkenntnisse oder Produkte erstellen können.

Ein Museum ist kein Gebäude voller Kunst. Die Playlist eines DJs besteht nicht nur aus den beliebtesten Songs. Die Story eines Reporters ist nicht nur eine Liste mit Fakten. Genau wie ein Museum, eine Playlist oder ein mit dem Pulitzer-Preis ausgezeichneter Artikel ist ein intestine kuratierter Datensatz viel mehr als die Summe seiner Teile. Und der Kurator ist kein Datenbankadministrator. Wie alle Erlebnisschöpfer benötigt der Kurator ein tiefes Verständnis des Geschäfts und zunehmend ein tieferes Verständnis der Analyse-Engines, die die Daten nutzen, eine Grundlage für das Lösungsdesign.

Ein paar Dinge zum Nachdenken

„Wir haben mehr Daten, als wir damit anfangen können, wir müssen sie für x nutzen können.“ Ein allgemeiner Chorus, und die erste Hälfte ist oft mehr als wahr – die Organisation weiß nicht, was sie damit anfangen soll. Und gleichzeitig haben wir viele Organisationen den Wendepunkt überschritten, von der Nichtspeicherung von Daten hin zum Versuch, alles zu speichern, in der Hoffnung, dass es eines Tages nützlich sein wird. Sie zahlen jetzt zu viel für die Speicherung von Daten, die überhaupt keinen Wert mehr haben.

Bei vielen Prognose- und Preisproblemen ist die Realität so, dass die Datenmenge, die die meisten Unternehmen speichern, winzig ist im Vergleich zu den Datensätzen, die für die Schaltung von On-line-Anzeigen, die Schulung selbstfahrender Autos, die Diagnose medizinischer Bilder usw. verwendet werden Wenn Sie Ihre Aufmerksamkeit auf die Lösung eines bestimmten Issues richten, wird es noch „kleiner“. Wenn Sie beispielsweise saisonale Ausverkäufe haben, besagt die gängige Meinung, dass Sie Daten von mindestens drei Saisons benötigen, um die saisonalen Auswirkungen abzuschätzen. Das bedeutet, dass Sie Daten aus drei Jahren benötigen, um den Weihnachtseffekt abzuschätzen. Die Wahrheit ist, dass viele Produkte keine drei Jahre halten. Auf den ersten Blick verfügen Sie möglicherweise über 78-wöchige Daten für 20.000 Produkte in 500 Filialen (780 Millionen Datensätze) und immer noch nicht über genügend Daten, um herkömmliche Algorithmen für Prognosen auf SKU-Filialenebene auszuführen. Die gute Nachricht ist: Wenn Sie die richtigen Daten für andere Produkte aus vergangenen Jahren gespeichert haben, können Ihnen Datenkuratierung und effektive Modellierung tatsächlich dabei helfen, dieses Downside zu lösen.

Wir hören auch den häufigen Spruch, dass meine Daten nicht intestine genug seien. Früher habe ich das als Grund akzeptiert, nicht damit anzufangen, aber die Kombination aus effektiver Datenkuratierung und Techniken des maschinellen Lernens vertritt stark die Meinung, dass die Kuratierung der Daten und die Anwendung von Algorithmen nicht nur dabei helfen werden, diese Herausforderungen zu meistern, um Mehrwert zu liefern, sondern auch ein wirksames Instrument zur Identifizierung und Behebung von Datenproblemen sein. Der Punkt ist, dass eine effektive Datenkuratierungsfunktion uns hilft, die Mängel unserer Daten zu beseitigen und sie nutzbar zu machen.

Je weiter wir in das digitale Zeitalter vordringen, desto wichtiger wird die Datenkuratierung. Unternehmen, die heute in diese entscheidende Fähigkeit investieren, werden morgen erhebliche Vorteile erzielen und ihre Daten in einen echten Wettbewerbsvorteil verwandeln. Es steht viel auf dem Spiel, aber die Wahl ist klar: Kuratieren Sie Ihre Daten oder bleiben Sie auf der Strecke. Es reicht nicht aus, Daten lediglich zu sammeln und zu speichern – Unternehmen müssen sie aktiv kuratieren, um ihr volles Potenzial auszuschöpfen. In dieser sich schnell verändernden Landschaft ist die Entscheidung einfach: kuratieren oder zurückbleiben.

Über den Autor

Colin Kessinger ist Government Associate bei Ethos Capital und arbeitet mit den Mitgliedern des Investmentteams und anderen Government Partnern zusammen, um potenzielle Investitionsmöglichkeiten zu identifizieren, zu analysieren und zu bewerten. In den letzten 30 Jahren warfare er in Vordenker- und Unternehmensführungspositionen tätig und konzentrierte sich auf die Anwendung quantitativer Techniken auf Lieferketten, Preisgestaltung, Handelsförderung, Kundeneinblicke und Risikomanagement. Colin hat umfassend in den Bereichen Rechenzentren, Halbleiter, Biowissenschaften, Investitionsgüter, Hightech, Elektronik, Telekommunikation, Unterhaltungselektronik, CPG und Automobil beraten. Er ist regelmäßig außerordentlicher Professor für Operations Administration an der Stanford College und der UC Berkeley.

Melden Sie sich für die kostenlosen insideAI-Information an E-newsletter.

Begleiten Sie uns auf Twitter: https://twitter.com/InsideBigData1

Treten Sie uns auf LinkedIn bei: https://www.linkedin.com/firm/insideainews/

Begleiten Sie uns auf Fb: https://www.fb.com/insideAINEWSNOW

Schauen Sie bei uns vorbei YouTube!



Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert