Ich werde skalierbare ETL-Pipelines mit Databricks entwickeln
Über diesen Service
Braucht du eine robuste und skalierbare ETL-Pipeline, die auf Databricks basiert? Du bist hier genau richtig!
Ich bin Gajendra, ein zertifizierter Data Engineer und Data Analyst mit über 6 Jahren Erfahrung im Aufbau von End-to-End-Datenlösungen für Unternehmenskunden. Egal, ob du mit Batch- oder Streaming-Daten arbeitest, ich spezialisiere mich auf das Design von sauberen, effizienten und produktionsbereiten ETL-Pipelines mit Databricks, PySpark und AWS.
Was ich anbiete:
- End-to-End-ETL/ELT-Pipeline-Entwicklung auf Databricks
- Datenaufnahme aus mehreren Quellen (S3, RDS, APIs usw.)
- Datenbereinigung, -transformation und -anreicherung mit PySpark
- Integration mit Delta Lake, SQL und Cloud-Speicher
- Workflow-Orchestrierung mit Databricks Jobs oder Apache Airflow
- Versionskontrollierte Bereitstellung (Git, CI/CD)
- Dokumentation und notebook-basierte Lieferung
Tools & Technologien: Databricks (Jobs, Notebooks, Delta Lake), PySpark, SQL, AWS (S3, Glue, Lambda, RDS), Airflow / Databricks Workflows, Git, CI/CD, DBFS
Warum mit mir arbeiten?
- Zertifiziert in Databricks & AWS
- 6+ Jahre Erfahrung in Data Engineering & Analytics
- Schnelle und klare Kommunikation
- Code auf Produktionsniveau mit wiederverwendbarem Design
Lass uns deine Daten-Workflows automatisieren und richtig skalieren!
FAQ
Automatische Übersetzung
Was benötigen Sie von mir, um zu beginnen?
Ein kurzer Überblick über deine Datenquellen, erwartete Ausgaben und Cloud-Setup (falls vorhanden).
Kannst du mit On-Prem-Daten oder anderen Cloud-Anbietern arbeiten?
Ja, aber AWS ist meine Kernkompetenz. Wir können andere Optionen besprechen.
