Ich entwerfe große Datenmodelle und ETL-Pipelines mit pyspark und databricks

Einige Informationen wurden automatisch übersetzt.

Indien

Ich spreche Hindi, Gujarati, Englisch

34 Aufträge abgeschlossen

Experte für Data Engineering und Cloud-Lösungen-Architekt

Erfahrener Azure-Dateningenieur mit über 13 Jahren Erfahrung beim Aufbau skalierbarer Datenlösungen mit Microsoft Fabric, Azure Data Factory (ADF), Azure Data Lake und Synapse Analytics. Ich arbeite a...
Über diesen Service

Verarbeite Petabytes an Daten im Handumdrehen mit optimierten PySpark-Modellen und Databricks-Pipelines, die unendlich skalieren.


Überfordert von riesigen Datensätzen, die herkömmliche Systeme zum Absturz bringen? Brauchst du Echtzeitverarbeitung, die Milliarden von Datensätzen mühelos bewältigt? Hier ist dein Big Data Architekt.


Was du bekommst:

  • Skalierbare PySpark-Datenmodelle und Transformationen
  • Optimierte Databricks-Cluster-Konfigurationen
  • Delta Lake-Architektur für ACID-Transaktionen
  • Echtzeit- und Batch-Verarbeitungs-Pipelines
  • Leistungsoptimierte Spark SQL-Abfragen
  • Kostenoptimierungsstrategien und Monitoring-Setup


Meine Big Data Expertise:

Mit 13+ Jahren Erfahrung in der Architektur von Spark-Lösungen habe ich Pipelines gebaut, die täglich über 500 TB verarbeiten, und dabei durch fortschrittliche Optimierungstechniken und Cluster-Tuning eine 10-fache Leistungssteigerung erzielt.


Technologien, die ich beherrsche:

  • Plattformen: Databricks, Apache Spark, Delta Lake, MLflow
  • Sprachen: PySpark, Scala, Spark SQL, Python
  • Optimierung: Catalyst-Optimizer, Partitionierung, Caching-Strategien

Sprache:

Englisch

Technische Expertise:

Apache-Funken

Databricks

Snowflake

Expertise:

Datenpipelines

ETL-Entwicklung

Data-Warehousing

Industrie:

Datenanalyse

Finanzdienstleistungen

Meine weiteren Dienstleistungen im Bereich Datentechnik