Ich verarbeite und analysiere Big Data mit pyspark sql
Senior Data Engineer
Über diesen Service
Hast du große Datenmengen, die schnell und effizient verarbeitet werden müssen?
Ich bin Senior Data Engineer spezialisiert auf PySpark, Azure Databricks und Delta Lake. Ich habe Prozesse um bis zu 40-60% optimiert, um skalierbare, sichere und leistungsstarke Pipelines für Top-Unternehmen zu schaffen.
Ich kann deine massiven Daten verarbeiten, mehrere Quellen integrieren, die Daten bereinigen und datasets liefern, die bereit für Analysen, Dashboards oder Machine-Learning-Modelle sind.
Technologie:
Apache-Funken
•
Python
•
Andere
Mein Portfolio
FAQ
Automatische Übersetzung
Brauchst du Zugriff auf meine Cloud-Plattform?
Nur wenn du die direkte Ausführung in deiner Umgebung möchtest. Ich kann auch offline mit anonymisierten Daten arbeiten.
Kannst du eine wiederverwendbare Pipeline erstellen?
Ja, ich liefere vollständig strukturierte und skalierbare Codes.
Kannst du eine bestehende Pipeline verbessern?
Ja, ich kann sie optimieren, um Kosten zu senken und die Zeiten zu verbessern.
