Ich werde eine produktionsbereite ETL-Datenpipeline mit AWS, airflow und pyspark aufbauen

Einige Informationen wurden automatisch übersetzt.

Pakistan

Ich spreche Englisch

Dateningenieur, AWS, Apache Airflow, Spark, PostgreSQL, ETL

Ich bin Dateningenieur und Student im letzten Jahr der Informatik mit praktischer Erfahrung im Aufbau skalierbarer ETL-Pipelines und Datenarchitekturen. Ich habe bei Cognetix.io an unternehmensgerecht...
Über diesen Service

Hast du Schwierigkeiten mit Rohdaten und keinen zuverlässigen Weg, sie zu verarbeiten?

Ich baue produktionsreife Datenpipelines, die automatisch laufen, mit deinen Daten skalieren und niemals still und heimlich versagen. Keine spaghettiartigen Skripte. Keine manuellen Schritte. Einfach saubere, zuverlässige Daten genau dort, wo du sie brauchst.


Was ich baue

  • ETL-Pipelines mit Python und PySpark zum Extrahieren, Transformieren, Laden, fertig
  • Apache Airflow DAGs für vollständig automatisierte, geplante Workflows
  • Medallion-Architektur-Pipelines (Bronze, Silver, Gold) mit Datenqualität in jeder Schicht
  • AWS-Datenplattformen S3 Data Lake, Glue, EMR auf EKS, IAM, Terraform
  • Cloud-Ingestion-Pipelines von beliebigen Quellen in PostgreSQL, MySQL, ClickHouse oder Supabase
  • Vollständig containerisierte Setups mit Docker und Docker Compose
  • Deployments mit einem Befehl, CI/CD, kein manuelles SSH, keine Runbooks

Expertise:

Big Data

Datenextraktion

Datenfluss

Datenmanipulation

Technologie:

Amazon Redshift

Apache Kafka

Apache-Funken

Python

SQL

Mein Portfolio