Ich werde einen AWS Data Lake und ETL-Pipeline mit PySpark aufbauen

Einige Informationen wurden automatisch übersetzt.

Pakistan

Ich spreche Englisch

Cloud Data Engineer, der skalierbare ETL-Pipelines baut

Hallo, ich bin ein unabhängiger Data Engineer, spezialisiert auf den Bau skalierbarer ETL-Pipelines und robuster Cloud-Datenarchitekturen. Ich helfe Unternehmen, unstrukturierte, chaotische Logs in sa...
Über diesen Service

Als Data Engineer entwerfe ich robuste cloud-native Architekturen und skalierbare ETL-Pipelines. Ob ich große Log-Daten verarbeite oder Medallion Data Lakes aufbaue, ich liefere saubere, optimierte Lösungen.

Was ich anbiete:

  • End-to-End ETL-Pipelines: Automatisierte Datenextraktion, -transformation und -ladung mit Python und PySpark.
  • Cloud Data Lakes: Architektur von serverlosen Medallion Data Lakes (Bronze, Silver, Gold) auf AWS (S3, Glue, Athena).
  • Datenbankarchitektur: Entwurf relationaler Datenbanken (3NF) und Optimierung komplexer SQL-Abfragen (CTEs, Window Functions) in PostgreSQL.
  • Performance-Optimierung: Reduzierung der Datenverarbeitungszeiten und Senkung der Speicherkosten durch Formate wie Apache Parquet.

Technologie-Stack: AWS (S3, Glue, Athena) | PySpark | Python | PostgreSQL | Fortgeschrittene SQL | Git/GitHub

Warum du mich wählen solltest? Ich schreibe produktionsbereiten Code, sorge für skalierbare Designs und halte mich strikt an Best Practices im Data Engineering.

Bitte schreibe mir vor der Bestellung, um dein genaues Projekt zu besprechen!

Sprache:

Englisch

Urdu

Technische Expertise:

dbt (Datenerstellungstool)

Apache Airflow

Expertise:

Datenpipelines

ETL-Entwicklung

Datenintegration

Industrie:

Datenanalyse

Mein Portfolio