In dieser Diskussion möchte ich die sich entwickelnden Tendencies in der Datenorchestrierung und Datenmodellierung untersuchen und die Fortschritte bei den Instruments und ihre wichtigsten Vorteile fĂŒr Dateningenieure hervorheben. WĂ€hrend Airflow seit 2014 der dominierende Akteur ist, hat sich die Datentechniklandschaft erheblich verĂ€ndert und befasst sich jetzt mit anspruchsvolleren AnwendungsfĂ€llen und Anforderungen, einschlieĂlich der UnterstĂŒtzung mehrerer Programmiersprachen, Integrationen und verbesserter Skalierbarkeit. Ich werde zeitgenössische und vielleicht unkonventionelle Instruments untersuchen, die meine Datentechnikprozesse rationalisieren und es mir ermöglichen, mĂŒhelos robuste, dauerhafte und skalierbare Datenpipelines zu erstellen, zu verwalten und zu orchestrieren.
Im letzten Jahrzehnt erlebten wir eine âkambrische Explosionâ verschiedener ETL-Frameworks fĂŒr Datenextraktion, -transformation und -orchestrierung. Es ist keine Ăberraschung, dass viele davon Open Supply und auf Python basieren.
Die beliebtesten:
- Luftstrom, 2014
- Luigi, 2014
- PrÀfekt,2018
- Zeitlich, 2019
- Flyte, 2020
- Dagster, 2020
- Magier, 2021
- Orchester, 2023