Ich baue und optimiere skalierbare databricks delta lake Pipelines
Data Engineering, Azure, AWS, Databricks, Lakehouse, Spark, Fabric
Über diesen Service
Microsoft & Databricks zertifizierter Senior Data Engineer mit über 9 Jahren Erfahrung
Hör auf, mit unordentlichen Daten zu kämpfen. Baue ein unternehmensgerechtes Lakehouse, das skaliert. Als doppelt zertifizierter Experte entwerfe und optimiere ich produktionsbereite Datenplattformen auf AWS, Azure und Databricks.
Was ich liefere:
- Medallion-Architektur: Vollständige Implementierung der Bronze-, Silber- und Gold-Schichten für Datenintegrität.
- Skalierbare Pipelines: Hochleistungsfähiges Batch- und Streaming-ETL/ELT mit PySpark und Spark SQL.
- Databricks-Ökosystem: Meisterschaft im Unity Catalog (Governance), Delta Live Tables (DLT) und Asset Bundles (DABs).
- Cloud-Integration: Experteneinrichtung für AWS (S3, Glue, EMR, Athena) und Azure (Fabric, ADF, Synapse, OneLake).
- Kostenoptimierung: Fortgeschrittenes Tuning (Z-Order, Liquid Clustering), um deine Cloud-Compute-Ausgaben zu senken.
- AI-ready Daten: Spezialisierte Datenvorbereitung für GenAI, RAG-Chatbots und Mosaic AI.
Warum mit mir arbeiten?
- Über 9 Jahre Erfahrung: Tiefgehende Erfahrung mit unternehmensweiten, komplexen Datenumgebungen.
- Produktionsreif: Sauberer, gut dokumentierter und wartungsfreundlicher Code.
- Performance-Fokus: Systeme, die für Sub-Sekunden-Abfragen und maximale Effizienz optimiert sind.
- Verwandle deine Rohdaten in eine strategische Ressource. Kontaktiere mich noch heute
Mein Portfolio
FAQ
Automatische Übersetzung
Welche Art von Projekten bearbeiten Sie?
Ich kümmere mich um ETL-Pipelines, Lakehouse-Architektur, Cloud-Migration, Datenoptimierung und Analytics-Pipelines.
Mit welchen Cloud-Plattformen arbeitest du?
AWS, Azure und Databricks.
Arbeitest du sowohl mit Batch- als auch mit Streaming-Daten?
Ja, ich arbeite mit Batch-, Near-Realtime- und Streaming-Datenpipelines.
Welche Tools und Technologien verwenden Sie?
PySpark, Spark SQL, Azure Data Factory, AWS Glue, Databricks, EMR, Synapse und mehr.
Kannst du bestehende Pipelines optimieren?
Ja, ich spezialisiere mich auf Performance-Tuning und Kostenoptimierung.
Stellst du Dokumentation bereit?
Ja, klare technische Dokumentation ist inklusive.
Kannst du mehrere Datenquellen integrieren?
Absolut — APIs, Datenbanken, Cloud-Speicher und Flat Files.
Unterstützt du langfristige Projekte?
Ja, ich bin offen für langfristige und laufende Support-Engagements.
Sind meine Daten sicher?
Ja. Ich folge den besten Branchenpraktiken für Datensicherheit und Zugriffskontrolle.
Arbeitest du mit großen Datensätzen?
Ja, ich bearbeite regelmäßig Millionen bis Milliarden von Datensätzen.

