Möchtest du deine Datenworkflows automatisieren? Ich spezialisiere mich auf den Aufbau skalierbarer, kosteneffektiver ETL-Pipelines mit Python und AWS, um deine Rohdaten in umsetzbare Erkenntnisse zu verwandeln.
Was ich für dich tun kann:
- AWS Glue Jobs: Entwicklung robuster ETL-Skripte mit PySpark für die groß angelegte Datenverarbeitung oder Python Shell für leichte Integrationen.
- Serverlose Pipelines: Aufbau ereignisgesteuerter Workflows mit AWS Lambda und S3-Triggern.
- Datenorchestrierung: Einrichtung und Verwaltung von Workflows mit AWS Step Functions oder Glue Workflows.
- Datenladen: Effizientes Laden von Daten in Amazon Redshift, S3 (Data Lakes) oder RDS.
- API-Integration: Datenextraktion aus Drittanbieter-APIs mit Python und sichere Speicherung in AWS.
- Optimierung: Feinabstimmung bestehender Glue-Jobs, um DPU-Kosten (Data Processing Unit) zu senken.