Bild vom Autor
Man sagt, man sollte beim Kauf von Dingen auf das Preis-Leistungs-Verhältnis achten. Das beste Preis-Leistungs-Verhältnis bekommt man jedoch, wenn man etwas bekommt, Intestine für frei. Aber gibt es so etwas wirklich? Angeblich nicht, wenn man dem Sprichwort Glauben schenkt: „Es gibt kein kostenloses Mittagessen.“
Ich behaupte, es gibt ein kostenloses Mittagessen, und ich werde es beweisen! Ich habe 10 lehrreiche „kostenlose Mittagessen“ ausgegraben – frei Information-Engineering-Kurse, die auch bieten Qualität Wissen. Es stimmt; es gibt viel mehr Vielfalt und Auswahl, wenn Sie Dutzende, Hunderte oder manchmal sogar Tausende von Greenback bezahlen können oder wollen.
Viele dieser Kurse werden in einigen anderen Pay attention kostenloser Kurse als kostenlos angesehen. Für manche Leute ist es kostenlos, einmalig 90 $ oder 45 $/Monat zu zahlen. Aber viele Leute haben das Geld für einen „kostenlosen“ Kurs nicht, obwohl sie sehr bereit sind, Information Engineering zu lernen. (Und seien wir mal ehrlich! Kostenlos bedeutet wörtlich, nun ja, kostenlos! Nicht „billig“, nicht „sehr wenig Geld“ oder „erschwinglich“. Kostenlos!)
Soweit ich recherchiert habe, sind diese Kurse wirklich kostenlos. Viele sind von edX. Wenn Sie den kostenlosen Zugang zum Kurs wählen, müssen Sie ihn in einer bestimmten Zeit absolvieren, normalerweise etwa sechs Monate. Aber das sollte ausreichen, um jeden Kurs bequem abzuschließen. Außerdem bedeutet der kostenlose Zugang, dass Sie keinen lebenslangen Zugriff auf alle Materialien haben (sie werden gelöscht, sobald Sie fertig sind) und kein Zertifikat erhalten. Trotzdem sollten Sie diese Kurse nutzen können, um etwas über Datentechnik zu lernen.
Bevor ich über die Kurse spreche, lassen Sie uns kurz über die Rolle des DateningenieursAuf diese Weise wissen Sie leichter, worauf Sie bei den Kursen achten müssen.
Die Rolle eines Dateningenieurs verstehen
Vereinfacht ausgedrückt sind Dateningenieure dafür verantwortlich, Daten den Mitgliedern des Datenteams und anderen Beteiligten zur Verfügung zu stellen. Dabei verarbeiten sie Daten und bauen und pflegen die Dateninfrastruktur, z. B. ETL-Prozesse, Datenpipelines und Datenspeicher.
Natürlich sollten die Kurse alle oder einige dieser Fähigkeiten abdecken. Schauen wir uns die Kurse genauer an – Wortspiel beabsichtigt –, die Ihr kostenloses Bildungsmittagessen ausmachen.
Kostenlose Information Engineering-Kurse
1. Information Engineering von ASU
Plattform und Hyperlink zum Kurs: edX
Dauer: 5 Wochen mit 1-9 Stunden/Woche; lernen Sie in Ihrem eigenen Tempo
Beschreibung: Dieser Einführungskurs der Arizona State College konzentriert sich auf die Arbeit mit Datenbanken im Bereich Datentechnik und die Interaktion mit ihnen mithilfe von SQL. Sie lernen die Datenbankstruktur, das Sternschema und das Zusammenführen von Daten aus mehreren Tabellen kennen. Im letzten Schritt lernen Sie, wie Sie mit SQL Berichte erstellen und Skripte zur Datenverarbeitung schreiben.
2. Python und Pandas für Information Engineering von Pragmatic AI Labs
Plattform und Hyperlink zum Kurs: edX
Dauer: 4 Wochen mit 3-6 Stunden/Woche; lernen Sie in Ihrem eigenen Tempo
Beschreibung: In einem weiteren Einführungskurs von edX lernen Sie Python und Pandas für Information Engineering. Die Einführung in Python umfasst Themen wie einfache Anweisungen, Wenn Aussagen, während Schleifen und Funktionen. Anschließend lernen Sie die Datenmanipulation in Pandas (insbesondere DataFrames) und deren Alternativen wie NumPy, Spark und PySpark kennen. Im letzten Modul lernen Sie Python-Entwicklungsumgebungen und Versionskontrolle kennen.
3. Scripting mit Python und SQL für Information Engineering von Pragmatic AI Labs
Plattform und Hyperlink zum Kurs: edX
Dauer: 4 Wochen mit 3-6 Stunden/Woche; lernen Sie in Ihrem eigenen Tempo
Beschreibung: Wenn Sie SQL und Python für die Datentechnik gleichzeitig lernen möchten, ist dieser Kurs für Sie geeignet. Sie verwenden die in Python integrierten Datenstrukturen, um Daten zu bearbeiten und Python-Skripte für die Automatisierung von Datenaufgaben zu schreiben. Der Kurs bringt Ihnen auch Internet Scraping und die Verwendung von SQLite zum Speichern und Abfragen von Daten in Python bei. In Bezug auf SQL lernen Sie, wie Sie Daten aus einer MySQL-Datenbank importieren und exportieren und wie Sie MySQL-Abfragen in VSCode ausführen.
4. Cloud Information Engineering von Pragmatic AI Labs
Plattform und Hyperlink zum Kurs: edX
Dauer: 4 Wochen mit 3-6 Stunden/Woche; lernen Sie in Ihrem eigenen Tempo
Beschreibung: In diesem Kurs lernen Sie Information Engineering in der Cloud. Sie lernen Methoden des Information Engineering kennen, entwickeln verteilte Systeme, serverlose Information-Engineering-Systeme und Cloud-ETL-Pipelines und erfahren mehr über Information Governance. Dabei kommen Sie mit Technologien in Berührung wie:
- CUDA
- Numba
- ASICs
- Colab Professional
- Colab-API
- Google BigQuery
- AWS
- Databricks SQL
- Klicken
- Python
- Rost
Dies ist auch ein Einführungskurs, für den keine Voraussetzungen erforderlich sind.
5. Erstellen von ETL- und Datenpipelines mit Bash, Airflow und Kafka von IBM
Plattform und Hyperlink zum Kurs: edX
Dauer: 5 Wochen mit 2-4 Stunden/Woche; lernen Sie in Ihrem eigenen Tempo
Beschreibung: Dieser Kurs zur Datentechnik konzentriert sich auf den Aufbau von ETL und Datenpipelines. Während des Kurses lernen Sie, was ETL- und ELT-Prozesse sind, erstellen ETL mithilfe von Bash-Shell-Skripten, verwenden Apache Airflow zum Erstellen von Batch-Datenpipelines und Apache Kafka für Streaming-Datenpipelines.
Dies ist ein Einführungskurs in diese Themen, erfordert jedoch Erfahrung im Umgang mit relationalen Datenbanken, SQL und Bash-Shell-Skripting.
6. Information Warehousing und BI Analytics von IBM
Plattform und Hyperlink zum Kurs: edX
Dauer: 6 Wochen mit 2-3 Stunden/Woche; lernen Sie in Ihrem eigenen Tempo
Beschreibung: Dieser Aufbaukurs von IBM vermittelt Ihnen die Grundlagen von Information Warehouses, Information Marts und Information Lakes. Sie lernen, wie Sie Information Warehouses entwerfen, modellieren und implementieren. Genauer gesagt verwenden Sie CUBEs, ROLLUPs, materialisierte Ansichten und Tabellen. Sie lernen außerdem Fakten und dimensionale Modellierung, Datenmodellierung mit Stern- und Schneeflockenschemata, Staging-Bereiche für Information Warehouses, Datenqualität und das Auffüllen eines Information Warehouse mit Daten kennen. Im dritten Modul arbeiten Sie an Information Warehouse-Analysen in Cognos Analytics.
Der Kurs setzt Erfahrungen mit SQL und relationalen Datenbanken voraus.
7. Apache Spark für Information Engineering und maschinelles Lernen von IBM
Plattform und Hyperlink zum Kurs: edX
Dauer: 3 Wochen mit 2-3 Stunden/Woche; lernen Sie in Ihrem eigenen Tempo
Beschreibung: Noch ein Kurs für Fortgeschrittene. Er konzentriert sich auf das Unterrichten von Apache Spark. Es ist ein wichtiges Device in der Datentechnik, daher lernen Sie Spark Structured Streaming, GraphFrames, ETL-Prozesse und ML-Pipelines kennen. Darüber hinaus lernen Sie ML-Grundlagen wie Regression, Klassifizierung und Clustering.
Der Kurs erfordert grundlegende Kenntnisse in Apache Spark. Es wird außerdem empfohlen, dass Sie den Grundlagen zu Huge Information, Hadoop und Spark Kurs von IBM.
8. DE Zoomcamp
Plattform und Hyperlink zum Kurs: DataTalks.Membership
Dauer: 10 Wochen; lernen Sie in Ihrem eigenen Tempo
Beschreibung: Endlich ein Kurs von einer anderen Plattform! Dieses On-line-Bootcamp vermittelt Ihnen umfassendes Wissen im Bereich Information Engineering. Sie lernen Containerisierung und Infrastruktur, Workflow-Orchestrierung, Information Warehousing, Analytics Engineering, Batchverarbeitung und Streaming. Sie lernen Technologien wie Google Cloud Platform, Terraform, Docker, SQL, Mage, dbt, Apache Spark und Apache Kafka kennen.
Voraussetzung für dieses Bootcamp sind SQL-Grundkenntnisse. Außerdem ist es wünschenswert, dass du Erfahrung mit Python oder, falls nicht, einer anderen Programmiersprache hast.
9. DE Finish-to-Finish-Projekte
Plattform und Hyperlink zum Kurs: DE Akademie
Dauer: Keine Informationen.
Beschreibung: Dies ist ein projektbasiertes Projekt, in dem Sie den Umgang mit AWS, Snowflake, Python, Kafka, Azure, Databricks, Airflow und Tableau erlernen. Sie analysieren und transformieren Daten, migrieren sie und optimieren Arbeitsabläufe.
10. Scala-Programmierung für Information Science
Plattform und Hyperlink zum Kurs: Kognitive Klasse KI
Dauer: 20 Stunden; lernen Sie in Ihrem eigenen Tempo
Beschreibung: Dieser Lernpfad besteht aus drei Kursen. Der erste ist Scala 101, in dem Sie die Grundlagen der objektorientierten Programmierung, Fallobjekte und -klassen, Sammlungen und idiomatisches Scala lernen. Im zweiten Kurs, Spark-Übersicht für Scala Analytics, werden Sie in Apache Spark, RDDs, DataFrames für groß angelegte Datenwissenschaft und fortgeschrittene Spark-Themen (z. B. Hive mit Spark, Spark-Streaming) eingeführt. Der dritte Kurs befasst sich mit Scala in der Datenwissenschaft, wo Sie grundlegende Statistiken und Datentypen lernen, wie Sie Daten vorbereiten, Funktionen entwickeln, ein Modell anpassen, eine Pipeline erstellen und eine Rastersuche durchführen.
Abschluss
Kein Wunder, dass es einfacher ist, wenn man Geld hat – man hat Zugang zu mehr und vielfältigeren Kursen. Ja, es ist ätzend, kein Geld zu haben! Aber das bedeutet nicht, dass Sie Ihren Traum von einer Stelle als Dateningenieur aufgeben müssen.
Es ist viel schwieriger, sie zu finden, aber es gibt immer noch einige gute Kurse, die Ihnen grundlegende und fortgeschrittene Kenntnisse in Datentechnik vermitteln können. Ich habe zehn davon gefunden. Einige andere kostenlose Ressourcen, wie Blogs oder YouTube-Movies, können Ihnen helfen, das erforderliche Wissensniveau zu erreichen.
Wenn Sie fleißig genug, engagiert und beharrlich sind, können Sie sicher kostenlos eine Stelle als Dateningenieur ergattern.
Nate Rosidi ist Datenwissenschaftler und arbeitet in der Produktstrategie. Er ist außerdem außerordentlicher Professor für Analytik und Gründer von StrataScratch, einer Plattform, die Datenwissenschaftlern mit echten Interviewfragen von High-Unternehmen bei der Vorbereitung auf ihre Vorstellungsgespräche hilft. Nate schreibt über die neuesten Tendencies auf dem Arbeitsmarkt, gibt Interviewtipps, teilt Datenwissenschaftsprojekte und deckt alles ab, was mit SQL zu tun hat.