Ich helfe bei der Erstellung von pyspark notebooks und bei der Optimierung von Jobs

Einige Informationen wurden automatisch übersetzt.

Indien

Ich spreche Englisch

4 Aufträge abgeschlossen

Databricks, Unity Catalog, ADF, DLT

Tools, mit denen ich arbeite - Databricks, Unity Catalog, DLT, Azure, SQL Wobei ich helfe: - Design und Aufbau von ETL-Pipelines mit Azure Data Factory und Databricks - Optimierung langsamer oder feh...
Über diesen Service

Dauert dein PySpark-Job Stunden? Timeout dein SQL-Query?

Ich finde genau heraus, was ihn verlangsamt, und behebe es.

Ich habe PySpark-Jobs optimiert, die in Produktionsumgebungen Milliarden von Datensätzen verarbeiten. Ich weiß genau, wo ich schauen muss.


Was ich behebe:

  • Langsame PySpark-Transformationen und Aktionen
  • Partition-Skew und Speicherprobleme
  • Uneffiziente SQL-Abfragen bei großen Datensätzen
  • Spark-Konfiguration anpassen
  • DataFrame-Optimierung und Caching-Strategien


Du teilst deinen Code. Ich analysiere, behebe und erkläre genau, was falsch war und warum.

Schreib mir zuerst mit deinem Problem. Ich sage dir ehrlich, ob ich helfen kann.

Sprache:

Englisch

Technische Expertise:

Apache-Funken

Databricks

Andere

Expertise:

Datenpipelines

ETL-Entwicklung

Data-Warehousing

Andere

Industrie:

Datenanalyse

Verwandte Tags