Wenn ich eine Weile, weißt du wahrscheinlich, dass ich meine Karriere als als begonnen habe QA -Ingenieur Vor dem Übergang in die Welt von Datenanalyse. Ich bin nicht zur Schule gegangen, hatte keinen Mentor und landete in einem formellen Schulungsprogramm nicht. Alles, was ich heute kenne-von SQL bis zur Modellierung bis zum Geschichtenerzählen mit Daten-ist autodidaktisch. Und glauben Sie mir, es struggle eine Reise des Versuchs, des Irrtums, des Lernens und des erneuten Lernens.

Das Dilemma, das meine Karriere veränderte

Vor ein paar Jahren habe ich darüber nachgedacht, Organisationen zu wechseln. Wie viele Menschen in schnell entwickelnden technischen Rollen stand ich einer überraschend schwierigen Frage:

Welche Rolle mache ich eigentlich? Für welche Rollen soll ich mich bewerben?

Auf dem Papier struggle ich ein Datenanalyst. Aber in Wirklichkeit spreizte meine Rolle mehrere Funktionen: Schreiben von SQL -Pipelines, Erstellen von Dashboards, Definition von KPIs und Grabten in Produktanalysen. Ich struggle mir nicht sicher, ob ich mich für Analystenrollen, BI -Rollen oder etwas ganz anderes bewerben sollte.

Um die Sache noch schlimmer zu machen, waren die Jobtitel vage und Jobbeschreibungen wurden mit Schlagwörtern aufgebläht. Sie würden einen Beitrag mit dem Titel finden „Datenanalyst“ Die aufgelisteten Anforderungen wie:

  • ML -Pipelines bauen
  • Schreiben Sie komplexe ETL -Skripte
  • Verwalten Sie Datenseen
  • Erstellen Sie Dashboards
  • Gegenwärtige Erkenntnisse auf Führungsebene
  • Und oh, sei übrigens großartig im Stakeholder Administration

Es struggle überwältigend und verwirrend. Und ich weiß, dass ich nicht allein bin.

Schneller Vorlauf bis heute: Zum Glück entwickeln sich die Dinge weiter. Es gibt immer noch Überschneidungen zwischen den Rollen, aber Organisationen haben begonnen, sie klarer zu definieren. In diesem Artikel möchte ich die zusammenbrechen Wirkliche Unterschiede zwischen Datenrollendurch die Linse eines realen Beispiels.

Ein reales Szenario: treffen Quikee

Stellen wir uns ein fiktives Fast-Commerce-Startup namens namens vor Quikeestarten in mehreren indischen Städten. Ihr Wertversprechen? Liefern Sie Lebensmittel und Grundlagen innerhalb 10 Minuten.

Kunden stellen Bestellungen über die App oder Web site ab. Hinter den Kulissen befinden sich in den Städten Mikrokarten (auch als „dunkle Geschäfte“ bezeichnet) und eine Flotte von Lieferpartnern, die diese blitzschnellen Lieferungen herstellen.

Lassen Sie uns nun die Datenbedürfnisse dieses Unternehmens durchgehen – von dem Second, in dem eine Bestellung aufgegeben wird, bis zu den Führungskräften des Dashboards, die in ihren Treffen am Montagmorgen verwendet werden.

Schritt 1: Erfassen und Speichern von Rohdaten

In dem Second, in dem ein Kunde eine Bestellung aufgibt, Transaktionsdaten wird erzeugt:

  • Zeitstempel
  • Bestellausweis
  • Artikel bestellt
  • Preis
  • Rabattcodes
  • Kundenstandort
  • Zahlungsmethode
  • Zugeordneter Lieferpartner

Nehmen wir an, Quikee verwendet verwendet Amazon Kinesis Diese Daten in Echtzeit auf einen zu streamen S3 Knowledge Lake. Dieser Stream ist hochvolumig, zeitempfindlich und entscheidend für die Geschäftsverfolgung.

Aber hier ist der Haken: Rohdaten sind chaotisch. Sie können es nicht direkt zur Entscheidungsfindung verwenden.

Additionally, was passiert als nächstes?

Schritt 2: Datenpipelines erstellen

Geben Sie die Dateningenieure.

Sie sind verantwortlich für:

  • Echtzeitdaten einnehmen
  • Validierung der Schema -Konsistenz
  • Umgang mit Fehlern und Wiederholungen
  • Schreiben Sie Pipelines, um Daten von S3 in ein Knowledge Warehouse zu verschieben (sagen wir, Schneeflocke oder Rotverschiebung).

Hier ETL (Extrahieren, transformieren, laden) oder ELT Pipelines kommen ins Spiel. Dateningenieure reinigen, formatieren und strukturieren die Daten, um sie nachfrierbar zu machen.

Zum Beispiel kann eine Bestellentabelle in:

  • Bestellungen → Eine Zeile professional Bestellung
  • Order_items → Eine Zeile professional Artikel in einer Bestellung
  • Zahlungen → Eine Zeile professional Zahlungsversuch

In diesem Stadium werden Rohprotokolle in strukturierte Tabellen umgewandelt, mit denen Analysten arbeiten können.

Schritt 3: Dimensional Modeling & OLAP

Als Führung beginnt strategische Fragen wie:

  • „Welche Stadt bringt die meisten Einnahmen mit?“
  • „Welcher Geschäft ist unterdurchschnittlich?“
  • „Was ist unsere durchschnittliche Lieferzeit nach Zone?“

… Es wird klar, dass die direkten Abfrage von Transaktionsdaten nicht unmittelbar skaliert werden.

Das ist wo Dimensionsmodellierung kommt herein.

Anstelle von flachen rohen Tabellen werden Daten in Tatsache und Dimensionstabellen strukturiert.

🔸 Faktentische

  • Große, quantitative Datentabellen, die Fremdschlüssel sowie Maßnahmen und Metriken enthalten (MetrikenMeistens. Es gibt auch sachlose Faktentische, die keine Maßnahmen haben).
  • Beispiele: fact_ordersAnwesend fact_paymentsAnwesend fact_deliveries
  • Metriken wie Umsatz, Bestellzahl, Lieferzeit enthalten

🔹 Dimensionstabellen

  • Kleinere, beschreibende Tabellen, die helfen, die Daten in einer Faktentabelle zu verstehen
  • Beispiele: dim_storeAnwesend dim_productAnwesend dim_customerAnwesend dim_delivery_agent
  • Helfen Sie beim Filtern, Gruppen und Beiträgen für tiefere Erkenntnisse und schließen Sie sich an

Diese Struktur ermöglicht Olap– Schnelles, analytisches Abfragen über mehrere Dimensionen hinweg. Zum Beispiel können Sie jetzt Abfragen wie folgt ausführen:

„Zeigen Sie mir in den letzten 7 Tagen durchschnittliche Lieferzeit im Laden und Tagesstunde.“

Dieser Schritt wird von Dateningenieuren in den meisten Organisationen durchgeführt, aber ich habe nur wenige dunkle und faktische Tabellen aufgebaut, als ich als als arbeitete Enterprise Intelligence Ingenieur bei Amazon.

Schritt 4: Definieren von KPIs und Metriken

Hier Analytics Engineers (oder BI -Ingenieure) Glanz.

Sie sitzen zwischen der technischen Datenebene und den Geschäftsanwendern. Zu ihren Verantwortlichkeiten gehören häufig:

  • Definieren von KPIs (z. B. Abwanderungsrate, Wiederholung des Kaufs %, Zeit-zu-Vollfillment)
  • Schreiben von Logik für komplexe Metriken (z. B. Kohortenretention, aktive Benutzer)
  • Erstellen Semantische Modelle oder Metrikenschichten In Instruments wie DBT oder Looker
  • Gewährleistung einer konsistenten Definitionen im gesamten Unternehmen

Zum Beispiel bei Amazon hat unser Workforce keine Rohdaten abfragt, um Einnahmen jedes Mal zu berechnen. Stattdessen haben wir geschaffen vorabregierte Faktentische bei täglichen, wöchentlichen und monatlichen Körnern. Auf diese Weise blieben das Dashboards schneller geladen und die Metriken blieben in den Groups konsistent.

Analytics -Ingenieure fungieren als Übersetzer zwischen Ingenieurwesen und Geschäft – definieren Was Wir messen und Wie Wir messen es.

Schritt 5: Analyse, Berichterstattung und Geschichtenerzählen

Jetzt kommt die Rolle der Datenanalyst.

Mit sauberen, modellierten Daten bewaffnet, konzentrieren sie sich auf die Beantwortung von echten geschäftlichen Fragen wie:

  • „Warum hat die Retention in Bangalore letzten Monat gesunken?“
  • „Welche Gutscheincodes treiben die neuen Benutzer vor?“
  • „Was sind die High -Produkte in den ersten 30 Tagen neu?“

Sie bauen Dashboards in Werkzeugen wie Tableau, Energy BI oder Looker. Sie führen Advert-hoc SQL-Abfragen aus. Sie tauchen in A/B -Testergebnisse, Benutzerverhaltenstrends und Kampagneneffektivität ein.

Aber vor allem sie Geschichten erzählen mit Daten – komplexe Zahlen für die Stakeholder verständlich und umsetzbar.

Wer ist wer?

Vom Autor erzeugt

TL; DR: Wo passt du?

So denke ich darüber nach:

  • Ich liebe es, robuste Pipelines zu bauen und Skalierbarkeitsprobleme zu lösen? → Du bist a Dateningenieur
  • Lieben Sie es, Geschäftsmetriken zu definieren und komplexe Datensätze zu organisieren? → Du bist ein Analytics Engineer
  • Lieben Sie es, Erkenntnisse aufzudecken und mit Daten Geschichten zu erzählen? → Du bist a Datenanalyst

Natürlich mischen reale Rollen diese oft. Vor allem bei kleineren Unternehmen können Sie mehrere Hüte tragen. Und das ist okay.

Der Schlüssel ist nicht der Titel – aber wo Sie den größten Wert hinzufügen Und Was dich ansetzt.

Letzte Gedanken

Ich habe lange gebraucht, um zu verstehen, was ich tatsächlich tue – nicht nur, was meine Berufsbezeichnung sagt. Und wenn Sie jemals diese Verwirrung gespürt haben, sind Sie nicht allein.

Heute kann ich eindeutig sagen, dass ich an der Kreuzung von operiere DatenmodellierungAnwesend GeschäftslogikUnd Geschichtenerzählen– Ein Candy Spot zwischen Analytik und Ingenieurwesen. Und ich habe gelernt, dass die Fähigkeit, die Punkte zu verbinden, wichtiger ist als in eine perfekte Field zu passen.

Wenn Sie einen ähnlichen Weg gegangen sind – oder in Ihrer Rolle mehrere Hüte tragen – würde ich gerne Ihre Geschichte hören.

Schreiben Sie einen Kommentar ab 👇 oder teilen Sie dies mit jemandem, der es auch herausfindet.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert