Aufregende Neuigkeiten: Wir haben eine Daten Engineering Pfad Das bietet ein Coaching aus dem Scratch für alle, die Dateningenieur werden oder einige Daten für Daten technisch erlernen möchten.
https://www.youtube.com/watch?v=du1pirfi21a
Sieht cool aus, oder? Aber es wirft die Frage auf:
Warum Datentechnik lernen?
In der Regel bestehen Knowledge Science -Groups aus Datenanalysten, Datenwissenschaftlern und Dateningenieuren. Wir haben über die Unterschiede zwischen diesen gesprochen DatenrollenAber hier gehen wir tiefer in einige der Vorteile, Dateningenieur zu sein.
Dateningenieure sind die Personen, die alle Teile des Datenökosystems innerhalb eines Unternehmens oder einer Establishment verbinden. Sie erreichen dies, indem sie Dinge tun wie:
- Zugriff auf, sammeln, auditieren und reinigen Daten von Anwendungen und Systemen in einen verwendbaren Zustand
- Erstellen und Wartung effizienter Datenbanken
- Datenpipelines bauen
- Überwachung und Verwaltung aller Datensysteme (Skalierbarkeit, Sicherheit usw.)
- Implementierung der Ausgabe von Datenwissenschaftlern auf skalierbare Weise
Dateningenieur vs. Datenwissenschaftler
Alles, was oben aufgeführt ist, ist in erster Linie eine bestimmte Fähigkeit erforderlich: Programmierung. Dateningenieure sind Software program -Ingenieure, die sich auf Daten- und Datentechnologien spezialisiert haben.
Das unterscheidet sie ganz anders als Datenwissenschaftler, die sicherlich Programmierfähigkeiten haben, aber normalerweise keine Ingenieure sind. Es ist nicht ungewöhnlich, dass Datenwissenschaftler ihre Arbeit (z. B. ein Empfehlungssystem) an Dateningenieure zur tatsächlichen Implementierung übergeben.
Und während es Datenanalysten und Datenwissenschaftler sind, die die Analyse durchführen, sind es in der Regel Dateningenieure, die die Datenpipelines und andere Systeme erstellen, die erforderlich sind, um sicherzustellen, dass jeder einen einfachen Zugriff auf die benötigten Daten hat (und dass niemand Zugriff auf die hat Daten, die nicht).
Eine starke Grundlage für Software program -Engineering und -Programmierung vermittelt Dateningenieure, um die Instruments -Datenteams zu erstellen, und ihre Unternehmen müssen erfolgreich sein. Oder, as Jeff Magnusson Setzen Sie es aus:
Ich denke gerne an Lego -Blöcke. Ingenieure entwerfen neue LEGO -Blöcke, die Datenwissenschaftler auf kreative Weise zusammenstellen, um neue Datenwissenschaft zu schaffen.
Dies bringt uns zum ersten Grund, warum Sie vielleicht Daten Engineering lernen möchten:
1. Es ist das Rückgrat der Datenwissenschaft
Dateningenieure stehen an vorderster Entrance der Datenstrategie, damit es andere nicht sein müssen. Sie sind die ersten Personen, die sich mit dem Zustrom strukturierter und unstrukturierter Daten befassen, die in die Systeme eines Unternehmens eintreten. Sie sind die Grundlage für jede Datenstrategie. Ohne Lego -Blöcke kann man schließlich kein Lego -Schloss bauen.
Im obigen Datenwissenschaftshierarchie der Bedürfnisse (vorgeschlagen von Monica Rogati) Dateningenieure sind vollständig für die beiden unteren Zeilen verantwortlich und teilen die Verantwortung mit Datenanalysten und Datenwissenschaftlern für die dritte Zeile von unten.
Wie kritisch ist Datentechnik?
Stellen Sie sich vor, dass die oben abgebildete Pyramide als Trichter verwendet und auf den Kopf gestellt wird. Die Daten werden in die Spitze dieses Trichters gegossen, und die ersten Personen, die es berühren, sind Dateningenieure. Je effizienter sie bei der Filterung, Reinigung und Regie dieser Daten sind, desto effizienter kann alles andere sein, wenn die Daten weiter im Trichter und auf andere Teammitglieder fließen.
Umgekehrt, wenn die Dateningenieure sind nicht Effizient können sie als Block im Trichter dienen, der die Arbeit aller nachgelagerten Arbeiten schadet. Wenn beispielsweise eine schlecht gebaute Datenpipeline das Knowledge Science-Workforce unvollständige Daten füttert, kann jede Analyse, die sie auf diesen Daten durchführen, nutzlos sein.
Auf diese Weise fungieren Dateningenieure als Multiplikatoren für die Ergebnisse einer Datenstrategie. Sie sind die Riesen, auf deren Schultern Datenanalysten und Datenwissenschaftler stehen.
Dies zeigt sich in der Artwork und Weise, wie Unternehmen mit guten Datenstrategien ihre Groups strukturieren. Laut Jesse Anderson, einem Dateningenieur und Geschäftsführer der Massive Knowledge Institute:
Ein häufiger Ausgangspunkt sind 2-3 Dateningenieure für jeden Datenwissenschaftler. Für einige Organisationen mit komplexeren Anforderungen an Daten technisch können dies 4-5 Dateningenieure professional Datenwissenschaftler sein.
2. Es ist technisch herausfordernd
Einer der Python -Funktionen Datenanalysten und Wissenschaftler verwenden am meisten read_csv
– von der Pandas Bibliothek. Diese Funktion liest tabellarische Daten, die in einer Textdatei in Python gespeichert sind, damit sie untersucht und manipuliert werden können.
Wenn Sie zuvor mit Daten in Python gearbeitet haben, sind Sie wahrscheinlich sehr daran gewöhnt, so etwas zu tippen:
import pandas as pd
df = pd.read_csv("a_text_file.csv")
Einfach und bequem, oder? Der read_csv
Funktion ist ein gutes Beispiel für die Essenz von Software program Engineering: Erstellung abstrakter, breiter, effizienter und skalierbarer Lösungen.
Was bedeutet das und wie hängt es mit dem Lerndatenentwicklung zusammen? Lassen Sie uns einen tieferen Blick darauf werfen.
- Abstrakt: Beim Lesen einer Datei in einem Laptop, a Sehr komplexer Prozess tritt unter der Motorhaube auf. Unsere Verwendung der Funktion ist jedoch sehr einfach, da das, was im Hintergrund vor sich geht, vom Gebrauch abstrahiert wird. Sie müssen nicht verstehen, was
read_csv
tut „unter der Motorhaube“, um es effektiv zu verwenden. - Breit: Diese Funktion ermöglicht es uns auch, explizit auszuwählen, was der Trennzeichen in den Tabellendaten des Textes verwendet wird (z. B. Kommas, Semikolonen, Registerkarten usw.). Dies erleichtert die Verwendung mit einer Vielzahl von CSV -Stilen, und das ist Musik für die Ohren der Datenwissenschaftler. Und es gibt viele andere Optionen, die es Datenpraktikern ermöglichen, sich auf ihre Ziele zu konzentrieren, anstatt sich um Programmdetails sorgen zu müssen.
- Effizient:
read_csv
Funktioniert schnell und effizient und es ist auch effizient, in Code zu lesen. - Skalierbar: Eine andere Possibility, die in dieser Funktion enthalten ist, ermöglicht es uns, Dateien nach Stücken zu lesen. Wenn eine Datei zu groß ist, um in den RAM des Computer systems zu lesen, kann sie Chunk von Chunk gelesen werden, sodass Benutzer Dateien so groß wie sie kommen.
Robert A. Heinlein ist berühmt dafür, dass es gesagt hat:
Ein Mann Magie ist die Ingenieur eines anderen Mannes.
Es sind Dateningenieure, die diese Magie arbeiten und Instruments wie die bauen read_csv
Funktionen, die abstrakt, breit, effizient und skalierbar sind, damit sich der Relaxation des Groups auf die Daten selbst und ihre Analyse konzentrieren kann, anstatt mit Programmierrätseln zu kämpfen.
Gleichzeitig erfordert Knowledge Engineering wahrscheinlich weniger Mathematik als Knowledge Science. Wenn Sie additionally die Programmierung über Mathematik bevorzugen, könnte Knowledge Engineering eine ideale Possibility für Sie sein!
3. Es lohnt sich
Das Leben der Datenwissenschaftler leichter zu machen ist nicht das einzige, was Dateningenieure motiviert. Es ist nicht zu leugnen, dass Dateningenieure einen bedeutenden und wachsenden Einfluss auf die Welt im Allgemeinen haben.
Entsprechend Jüngste StatistikenWir erstellen jeden Tag mehr als 402 Milliarden Gigabyte Daten. Wenn das nicht genug struggle, wird angenommen, dass in den letzten zwei Jahren 90% der Daten der Welt erstellt wurden. Diese Unermesslichkeit der Daten hat Dateningenieure wertvoller als je zuvor gemacht. IoT Analytics Schätzungsweise mehr als 18,8 Milliarden IoT -Geräte Ende 2024, gegenüber etwa 16,6 Milliarden im Jahr 2023 und 14,4 Milliarden im Jahr 2022. Bei all diesem Wachstum kommt es viel mehr Daten von viel mehr Quellen und so viel mehr Bedarf an Dateningenieuren Wer kann es effektiv verarbeiten und kanalisieren.
Dies bedeutet, dass Dateningenieure eine Vielzahl von Möglichkeiten haben, wie sie ihre Interessen verfolgen und ihre Fähigkeiten vertiefen können. Um Ihnen eine Vorstellung davon zu geben, wie groß diese Welt ist, finden Sie hier eine Liste der beliebten Datenwerkzeuge und -technologien:
Natürlich muss ein Dateningenieur es nicht wissen alle Von diesen, aber diese Liste zeigt, wie viel es in der Welt der Datenentwicklung zu tun hat. Sobald Sie die Fähigkeiten haben, Jobs zu bekommen, haben Sie viel Freiheit, zu wählen, woran Sie arbeiten und an welchen Instruments Sie arbeiten.
Da Dateningenieure sowohl Daten- als auch Software program -Engineering -Fähigkeiten haben, können sie auch eine Vielzahl von Produkten aufbauen. Möchten Sie zu einem Startup im Frühstadium beitragen oder Unternehmer werden und eines Tages Ihr eigenes gefunden haben? Daten Engineering -Fähigkeiten bieten Ihnen die Instruments, die Sie benötigen, um großartige Produkte zu erstellen und zu analysieren, wie sich diese Produkte entwickeln. Sie können den Erfolg von so ziemlich allem implementieren und messen, was Sie sich vorstellen können.
Willst du distant arbeiten? Entsprechend Das US -amerikanische Büro für Arbeit und Statistik:
Der Anteil der Beschäftigten, die an Tagen, an denen sie arbeiteten, Zeit zu Hause arbeiteten, struggle ungefähr der gleiche wie im Jahr 2022 (34 Prozent), aber höher als im Jahr 2019 (24 Prozent) vor der Covid-19-Pandemie.
Wenn die Arbeit außerhalb des Büros etwas ist, das zu Ihnen passt, kann Knowledge Engineering Ihnen helfen, dieses Ziel zu erreichen. Da es eine hohe Nachfrage nach Dateningenieuren gibt und der größte Teil der Arbeit distant erledigt werden kann, ist es definitiv möglich, Fernbedienung zu finden Daten technische Jobsoder arbeiten Sie als freiberuflicher Auftragnehmer für kurzfristige Datenentwicklungsprojekte.
Schließlich haben Dateningenieure auch viele Möglichkeiten, der Group etwas zurückzugeben. Entsprechend 2024’s Stack Overflow Developer’s Survey:
93% der Befragten besuchen den Stack -Überlauf mindestens mehrmals professional Monat, wenn nicht mehrmals professional Tag.
Und da Sie über Daten und technische Fähigkeiten verfügen, können Sie einen wirklichen Unterschied machen, um coole neue Instruments für die Knowledge Science Group zu entwickeln.
4. Es zahlt sich intestine aus
Sie sollten niemals einen Jobbasis nehmen nur Im Gehalt, aber es ist nicht zu leugnen, dass das Gehalt wichtig ist!
Laut Glassdoor a Maschinenlerningenieur wird durchschnittlich 168.000 US -Greenback bezahlt. Beworben Datenwissenschaftler Positionen zahlen durchschnittlich 164.000 US -Greenback. Und Daten Engineering Positionen zahlen durchschnittlich 202.000 US -Greenback.”
Es ist keine Überraschung, warum. Datenentwicklungsfähigkeiten wie Python, SQL und The Shell gehören regelmäßig zu den am besten bezahlten Fähigkeiten in den Entwicklerumfragen von Stackoverflow. Und zum Zeitpunkt dieses Schreibens gibt es rund 140.000 Ergebnisse für den Suchbegriff Datenwissenschaftler auf LinkedIn und rund 251.000 Ergebnisse für den Suchbegriff Dateningenieur.
Eine Mehrheit der Unternehmen meldet Schwierigkeiten, qualifizierte Dateningenieure zu finden. In a Neuere Umfrage87% der Technologieführer gaben an, dass sie Schwierigkeiten haben, qualifizierte technische Talente auf dem aktuellen Markt zu sichern. Dieser anhaltende Talentmangel zeigt, dass die Nachfrage das Angebot immer noch übertrifft, obwohl mehr Menschen in das Feld eintreten. Mit Blick auf die Zukunft erscheint der Arbeitsmarkt für Dateningenieure widerstandsfähig. Die jüngste „Reset“ der Technologiebranche (mit einigen Entlassungen im Jahr 2022–23) struggle größtenteils eine Korrektur der Übereinstellung, und Experten erwarten Datenrollen bleiben bis 2025 gefragt.
Und das ist nicht alles! Nach Statista:
Der globale Massive -Knowledge -Markt wird voraussichtlich bis 2027 auf 103 Milliarden US -Greenback wachsen
5. Es ist wertvoll, auch wenn Sie kein Dateningenieur sein möchten
Auch wenn Sie keine Karriere als Dateningenieur verfolgen möchten, kann es sehr nützlich sein, Kenntnisse über Datengenieure zu kennen. Die Vorteile sind mehrfach:
- Als Datenpraktiker besteht eine gute Likelihood, dass Sie regelmäßig Aufgaben erledigen, die sich über andere Jobs, einschließlich Datengenieure, überschneiden.
- Das Erlernen einer anderen Sichtweise kann für Ihr Verständnis von Vorteil sein und bietet Ihnen die Möglichkeit, Fähigkeiten zu erfüllen, die Sie möglicherweise schon seit einiger Zeit nicht mehr verwendet haben.
- In technischen Fähigkeiten werden Sie autarker. Dies kann Ihrer Karriere enorm helfen, da Sie nicht mehr blockiert werden müssen und darauf warten, dass jemand etwas für Sie tut.
- Mit den Fähigkeiten zum Erlernen von Daten technischen Engineering können Sie sich in Dateningenieure einfühlen und besser mit ihnen kommunizieren. Dies hilft auch Ihrem Workforce, da Sie die Brücke werden können, die Ihre mit dem Knowledge Engineering -Workforce verbindet.
Abwickeln und nächste Schritte
Wir haben fünf gute Gründe untersucht, warum Knowledge Engineering ein so aufregendes und lohnendes Feld ist: Es ist das Rückgrat der Datenwissenschaft, es ist technisch herausfordernd, es ist zutiefst wirksam, es zahlt sich intestine aus und es ist wertvoll, auch wenn Sie nie offiziell ein Dateningenieur werden . Wenn es darum geht, geht es bei Daten Engineering um das Entwerfen von Systemen, mit denen Daten zugänglich, zuverlässig und analysiert werden. Hier werden die LEGOs, die unsere Daten mit Daten entwickelt haben, zusammengebracht, um neue Datenwissenschaft zu schaffen.
Wenn Sie bereit sind, den nächsten Schritt zum Dateningenieur zu werden – oder nur einige von unschätzbare technische Fähigkeiten zu Ihrem Daten -Toolkit hinzuzufügen -, müssen Sie sich in unserem Anmeldung anmelden Karriereweg des Datenentwicklungspfads. Wir haben es von Grund auf neu gestaltet, um Ihnen die praktische Erfahrung und das grundlegende Wissen zu bieten, das Sie benötigen.
Viel Glück für Sie und eine glückliche Codierung!