Ich schreibe und optimiere PySpark ETL-Pipelines für deine Datenworkflows

Einige Informationen wurden automatisch übersetzt.

Indien

Ich spreche Hindi, Englisch

Senior Data Engineer, Spark, Scala, AWS, Airflow, Kafka, Big Data

Ich bin Pankaj, ein Data Engineer mit über 3 Jahren Erfahrung im Aufbau großskaliger Datenpipelines, ETL-Workflows und Cloud-Datenplattformen. Ich spezialisiere mich auf Spark (Scala/PySpark), Airflow...

Über diesen Service

Suchst du einen zuverlässigen PySpark Data Engineer, der deine ETL-Pipelines baut oder optimiert?

Du bist hier genau richtig.

Ich bin Pankaj, ein Data Engineer mit über 3 Jahren Erfahrung bei Paytm, wo ich über 200 Produktions-ETL-Pipelines gebaut habe, die täglich mehr als 5 TB verarbeiten, mit PySpark, Airflow, AWS und Kafka.

Dieses Gig konzentriert sich zu 100 % darauf, schnelle, skalierbare und saubere PySpark ETL-Lösungen für dein Business zu liefern.

Was ich für dich tun kann

Sauberen und optimierten PySpark ETL-Code schreiben
End-to-End ETL-Workflows (extract transform load) aufbauen
SQL-Logik in PySpark-Transformationen umwandeln
Fehlerhafte oder langsame PySpark-Jobs beheben
Spark-Jobs optimieren, um Laufzeit und EMR-Kosten zu senken
PySpark mit AWS Glue, S3, EMR, Athena integrieren
Datenbereinigung, Validierung & Transformation
Bestehende ETL-Pipelines debuggen

Warum du mich wählen solltest

Produktionsbereiter, sauberer Code
Starke praktische Erfahrung
Schnelle Kommunikation und Lieferung
100 % Fokus auf Zuverlässigkeit und Skalierbarkeit
Praktisches Verständnis von Pipeline-Fehlern & Optimierungen

Technologien, die ich verwende

PySpark / Spark
AWS Glue, S3, EMR
SQL
Airflow (Workflow-Orchestrierung)
Kafka
Python & Scala

Hast du eine individuelle Anforderung?

Schreib mir jederzeit, ich antworte schnell.

Lass uns etwas Skalierbares aufbauen.

write and optimize pyspark etl pipelines for your data workflows

Vollbild

Präsentation anzeigen

FAQ

Automatische Übersetzung

Was brauchst du von mir, um anzufangen?

Datenbank-/API-Zugang, Beispiel-Daten, SQL-Logik oder Problemstellung.

Kannst du eine Verbindung zu meiner Datenbank oder API herstellen?

Ja — MySQL, PostgreSQL, MongoDB, APIs, S3 und mehr.

Optimierst du bestehende Pipelines?

Ja — Ich spezialisiere mich auf Laufzeitoptimierung und Debugging.

Kannst du AWS-Services integrieren?

Ja — Glue, S3, EMR, Lambda, Athena.

Können Sie ein NDA unterzeichnen?

Ja — Ich kann bei Bedarf unter NDA arbeiten.

Soll es kreativ werden?

Suchst du technische Experten?

Bist du bereit, Verbraucher zu erreichen und zu konvertieren?

Suchst du nach Autoren?

Sorge für einen smarteren Geschäftsbetrieb

Ich schreibe und optimiere PySpark ETL-Pipelines für deine Datenworkflows

Über diesen Service

FAQ

Verwandte Tags