Diese Dienstleistung ist vorübergehend nicht verfügbar

Ich werde Databricks ETL-Pipelines mit pyspark, Python und SQL aufbauen

Einige Informationen wurden automatisch übersetzt.

Indien

Ich spreche Englisch, Hindi

Zertifizierter Data Engineer, Big Data, Spark, Data Warehousing

Hallo, ich bin Kanchan, ein zertifizierter Data Engineer, der sich auf den Aufbau skalierbarer und zuverlässiger Datenlösungen spezialisiert hat. Ich entwerfe und optimiere ETL/ELT-Pipelines mit Pytho...
Über diesen Service

Ich entwerfe und erstelle skalierbare, leistungsstarke Data-Engineering-Lösungen mit Databricks und Apache Spark. Mein Schwerpunkt liegt auf PySpark-basierten ETL/ELT-Pipelines, Datenumwandlung und Optimierung, um Unternehmen bei der effizienten Verarbeitung großer Datenmengen zu unterstützen.

Zu meinen Dienstleistungen gehören das Erstellen von Databricks-Notebooks, das Ingestieren von Daten aus verschiedenen Quellen (Datenbanken, APIs, Cloud-Speicher), die Datenumwandlung mit Spark SQL und PySpark sowie die Bereitstellung sauberer, für Analysen geeigneter Datensätze. Ich implementiere auch Datenqualitätsprüfungen, Unit-Tests und Performance-Optimierungen, um zuverlässige und produktionsbereite Pipelines zu gewährleisten.

Ich arbeite hauptsächlich mit Databricks auf Cloud-Plattformen (Azure/AWS) und folge bewährten Praktiken in Datenmodellierung, Pipeline-Design und Dokumentation. Ob du eine kleine Databricks-Aufgabe, eine vollständige ETL-Pipeline oder eine End-to-End-Data-Engineering-Lösung brauchst – ich biete klare Kommunikation, pünktliche Lieferung und wartbaren Code.

Bitte schreibe mir vor der Bestellung, damit wir deine Anforderungen besprechen und das passende Paket für deinen Anwendungsfall auswählen können.

Zielplattform:

Google BigQuery

Databricks Lakehouse

mySQL

Tools und Plattformen:

Google Cloud Dataflow

Kafka Connect