Im Jahr 2022 waren die Dinge völlig anders.
Kinder wissen heutzutage nicht, wie es ist.
Früher habe ich Stunden damit verbracht:
- Schreiben Sie Python- und SQL-Code von Grund auf Zeile für Zeile
- Merken, welche Bibliotheken importiert werden sollen und welche Funktionen sie enthalten (aus sklearn.metrics import r2_score)
- Debuggen von Codefehlern
- Dokumentation für meinen Code schreiben
- Erstellen von Dashboards zur Analyse großer Datenmengen
Selbst im letzten Jahr, als die KI-Instruments immer fortschrittlicher wurden, hat sich mein Job als Datenwissenschaftler verändert. Ich bin weniger eine Programmiermaschine als vielmehr ein Stratege. Jemand, der die Daten in meiner Organisation wirklich intestine versteht und weiß, wie man sie am besten präsentiert und daraus Erkenntnisse ableitet.
Claude verändert die Dinge noch schneller
Claude ist eines dieser Werkzeuge, von denen ich glaube, dass sie die Branche und diese Karriere schneller verändern werden, als sich irgendjemand vorstellen kann. Ich werde nicht lügen, es ist irgendwie beängstigend. Gleichzeitig gibt es Möglichkeiten für Datenwissenschaftler, sich dieses Software zu eigen zu machen, es zu beherrschen und weiterhin die Nase vorn zu haben.
Hier sind 3 ENTSCHEIDENDE Fähigkeiten, an deren Beherrschung jeder Datenwissenschaftler jetzt arbeiten sollte:
1. Claude Dashboards

Früher habe ich einen ganzen Tag damit verbracht, für einen Kunden ein Tableau-Dashboard zu erstellen, nur um ein paar Fragen zu einem großen Datensatz zu untersuchen, der in ein paar Monaten vielleicht nie wieder angeschaut werden würde.
Jetzt kann Claude in wenigen Minuten ein voll funktionsfähiges, interaktives Dashboard erstellen, komplett mit:
- KPI-Metrikkarten
- Liniendiagramme
- Balkendiagramme
- Drilldown-Schaltflächen
- Tabs
- … und mehr
Lassen Sie uns ein einfaches Beispiel mit dem zeigen Stündlicher AEP-Energiedatensatz (CC0-Lizenz).
Claude-Eingabeaufforderung:
Ich habe einen Zeitreihendatensatz des stündlichen Energieverbrauchs (AEP_MW) mit einer Datums-/Uhrzeitspalte. Erstellen Sie mir ein interaktives HTML-Dashboard, das Folgendes umfasst:
1. Vier KPI-Karten mit durchschnittlicher Auslastung, Spitzenlast, minimaler Auslastung,
und Sommer-Winter-Vergleich
2. Ein Liniendiagramm, das die durchschnittliche Auslastung professional Stunde des Tages, aufgeteilt nach Wochentag und Wochenende, zeigt
3. Ein Balkendiagramm der durchschnittlichen monatlichen Auslastung, wobei höhere Monate in einer wärmeren Farbe hervorgehoben sind
4. Ein Balkendiagramm der durchschnittlichen Auslastung professional Wochentag mit Wochenenden in einer anderen Farbe. Verwenden Sie einen klaren, minimalistischen Stil.
Das Ergebnis sieht so aus:

Aus dem Dashboard stechen sofort einige Erkenntnisse hervor, die mit einer rohen CSV-Datei nicht möglich wären:
- Der Verbrauch an Wochentagen erreicht gegen 17:00 und 18:00 Uhr seinen Höhepunkt, während er am Wochenende früher (gegen 14:00 Uhr) seinen Höhepunkt erreicht und insgesamt auf einem niedrigeren Niveau liegt
- Der Verbrauch im Juli und August ist deutlich höher als in den Frühlingsmonaten, was eine starke Sommersaisonabhängigkeit aufgrund der Belastung der Klimaanlage bestätigt
- Samstags und sonntags sind die Belastungen durchweg etwa 10 % niedriger als an Wochentagen
Diese Arten von Dashboards eignen sich perfekt für EDA sowie für die Erstellung einmaliger Berichte für Stakeholder, die einfach nur wissen möchten, was zu einem bestimmten Zeitpunkt vor sich geht. Sie können auch ein Dashboard nach einem Zeitplan erstellen, sodass Sie jede Woche einen neuen Bericht erhalten.
2. Claude Cowork für die Priorisierung von Jira-Tickets und -Aufgaben

So sah ein typischer Montagmorgen für mich aus: Öffnen Sie Jira, klicken Sie sich durch 20 offene Tickets, versuchen Sie, sich den Kontext jedes einzelnen zu merken, finden Sie heraus, was was blockiert, und erstellen Sie eine grobe Prioritätenliste für die Woche.
Claude Cowork unterscheidet sich von Claude Chat dadurch, dass es tatsächlich eine Verbindung zu Ihrem Desktop herstellt und Dateien lesen/schreiben kann. Es kann eine Verbindung zu Jira (oder einer anderen Scrum-/Agile-Plattform) herstellen und Ihre Prioritäten für die Woche zusammenfassen. Hier ist ein Beispiel:
Ziehen Sie alle meine offenen Tickets aus dem aktuellen Dash. Geben Sie mir für jedes Ticket Folgendes: die Ticket-ID, eine Zusammenfassung dessen, was in einem Satz passieren muss, den aktuellen Standing und etwaige Blocker. Ordnen Sie sie nach Priorität und sagen Sie mir, was ich heute zuerst in Angriff nehmen soll.

Hier sind einige weitere Eingabeaufforderungen, die Sie mit Cowork verwenden können:
Tickets für Jira schreiben
Hier sind meine Notizen vom heutigen Mannequin-Evaluate-Assembly: (Notizen einfügen – oder Hyperlink zu den Notizen, wenn Ihr Cowork mit Google Drive verbunden ist). Erstellen Sie Jira-Tickets für jedes Aktionselement im DS-Projekt.
Schreiben Sie für jeden einen klaren Titel und eine zweiteilige Beschreibung dessen, was
was passieren muss und warum, legen Sie die Priorität basierend auf der Dringlichkeit fest,
und ordne sie dem aktuellen Dash zu.
Vorbereitung auf ein Stakeholder-Assembly
Lesen Sie die Kommentare der letzten drei Wochen zu Tickets mit dem Tag „Modellbereitstellung“ und schreiben Sie mir eine 5-Punkte-Statuszusammenfassung, die ich mit dem Leiter des Technikteams teilen kann. Halten Sie es untechnisch.
Erstellung einer Dokumentation von Grund auf
Öffnen Sie die Datei preprocessing_pipeline.py in meinem Projektordner und schreiben Sie einen README-Abschnitt, in dem erklärt wird, was die Pipeline tut, welche Eingaben sie erwartet und was sie ausgibt.
Berichterstattung zum Ende des Sprints
Schreiben Sie auf der Grundlage der geschlossenen Tickets dieses Sprints eine Sprintzusammenfassung mit drei Absätzen für meinen Vorgesetzten, in der dargelegt wird, was wir versandt haben, was wir gelernt haben und was auf den nächsten Dash übertragen wird.
Das spart enorm Zeit und sorgt außerdem für eine bessere Organisation.
3. Debuggen mit Claude Code

Claude Code ist ein Befehlszeilentool, das in Ihrem Terminal ausgeführt wird und vollen Zugriff auf Ihre Codebasis bietet. Es kann:
- Lesen Sie Dateien in Ihrem gesamten Projekt
- Befehle ausführen
- Führen Sie Checks durch
- Nehmen Sie Änderungen über mehrere Dateien hinweg vor
Für Datenwissenschaftler ist das Debuggen von Pipelines die unmittelbar nützlichste Anwendung.
Hier ist ein reales Szenario, das mir kürzlich bei der Arbeit mit dbt begegnet ist. Die Namen der Modelle und Dateien wurden geändert, sodass ich keine vertraulichen Unternehmensinformationen weitergebe.
Ich bin gerannt dbt run --select fct_energy_forecast und habe das hier bekommen:Database Error in mannequin fct_energy_forecast column "meter_reading_mw" doesn't exist LINE 14: AVG(meter_reading_mw) AS avg_load_mw,
Das Drawback bei DBT-Modellen besteht darin, dass ein Spaltenfehler in einem Downstream-Mart-Modell Ihnen nichts sagt Wo Die Säule ist tatsächlich kaputt gegangen. Es hätte in der Rohquelle, im Staging-Modell, in einer Zwischen-Aggregationsschicht oder im Mart selbst umbenannt werden können. Um die Grundursache manuell zu finden, müssten Sie jede Datei in der Abhängigkeitskette einzeln öffnen, den Spaltennamen bei jeder Transformation verfolgen und herausfinden, wo der alte Title nie aktualisiert wurde. Bei einem Projekt mit 24 Modellen und 6 Quellen könnte das mehr als eine Stunde Lesen, erneutes Ausführen und Neuaufbauen von Modellen erfordern.
Ich habe es stattdessen Claude Code gegeben:
Mein DBT-Modell fct_energy_forecast schlägt mit „Spalte meter_reading_mw existiert nicht“ fehl.
Finden Sie heraus, wo diese Spalte stromaufwärts definiert ist, und verfolgen Sie alle abhängigen Elemente
Modelle und Quelldateien, finden Sie heraus, was passiert ist, und beheben Sie das Drawback.
Claude las jede Datei in der Abhängigkeitskette und kam nach etwa 40 Sekunden mit einer Diagnose zurück.
Anschließend wurde der Repair auf alle drei Zeilen angewendet, das Modell erneut ausgeführt und bestätigt, dass es erfolgreich struggle.
Abschluss
Wenn sich die Instruments weiterentwickeln, werden sich auch unsere Rollen weiterentwickeln. Claude verändert die Artwork der Arbeit, die Datenwissenschaftler letztendlich leisten werden. Anstatt 8 Stunden am Tag damit zu verbringen, verschiedene DBT- und Python-Fehler zu debuggen, werden diese Fehler in 2 Minuten behoben, sodass wir mehr Zeit haben, tiefer in unsere Daten einzutauchen und wichtigere Fragen zu stellen. Als Datenwissenschaftler im Jahr 2026 ist es wichtig, dass wir unsere Fähigkeiten kontinuierlich erweitern und auf dem neuesten Stand bleiben.
Es ist auch wichtig zu beachten, dass Claude zwar über viele Fähigkeiten verfügt, es ist immer noch KI und kann (und tut) Fehler machen. Datenwissenschaftler, die Claude beherrschen, werden weiterhin benötigt, um Daten zu validieren, Eingabeaufforderungen und Prozesse zu verbessern und Claude zu korrigieren, wenn er falsch ist.
