Ich werde automatisierte ETL-Pipelines mit Apache Airflow erstellen, die Daten konsolidieren
Datenwissenschaftler
Über diesen Service
Ich erstelle produktionsreife ETL (Extract, Transform, Load)-Pipelines mit Apache Airflow, um deinen Datenworkflow zu automatisieren und Daten aus mehreren Quellen in dein Cloud-Lager zu konsolidieren.
WAS DU BEKOMMST
Apache Airflow Einrichtung & Konfiguration
- Produktionsbereite Airflow DAGs
- Jobplanung und Automatisierung
- Fehlerbehandlung und Wiederholungslogik
Datenquellenintegration
- Verbindung zu beliebigen APIs oder Datenbanken
- Unterstützung: Shopify, Stripe, HubSpot, Google Analytics usw.
- Individuelle Konnektoren nach Bedarf
Datenumwandlungen
- Rohdaten bereinigen und validieren
- dbt-Datenmodellierung
- Geschäftslogik umsetzen
Cloud-Lager Einrichtung
- BigQuery, Snowflake oder Redshift
- Optimierte Schemata
- Partitionierungsstrategien
Datenqualität & Validierung
- Automatisierte Qualitätsprüfungen
- Anomalieerkennung
- Slack/Email-Benachrichtigungen
Dokumentation & Support
- Architekturdiagramme
- Setup-Anleitungen
- Unterstützung nach der Lieferung
Tools und Plattformen:
Andere

