Ich erstelle und automatisiere ETL-Datenpipelines mit Python
Über diesen Service
Hast du Daten, die über verschiedene Systeme verteilt sind und nie miteinander sprechen? Werden deine Berichte noch manuell jede Woche erstellt?
Ich designe und automatisiere ETL-Datenpipelines mit Python, damit deine Daten dorthin fließen, wo sie hin sollen, pünktlich und ohne manuellen Aufwand.
Ich habe Produktionspipelines bei Carrefour (PySpark + Airflow auf GCP) und Cognizant (BI-Pipelines für globale Kunden) gebaut. Ich weiß, wo es in echten Datenproblemen hakt und wie man das verhindert.
Was ich baue
- ETL-Pipelines: Daten aus APIs, Datenbanken, Excel, CSVs extrahieren
- Daten transformation und Reinigung mit Python & Pandas
- In BigQuery, MySQL, Google Sheets laden
- Geplante Automatisierung mit Airflow
- Automatisierte Berichte pünktlich liefern, ohne manuellen Aufwand
Technologie-Stack
Python · SQL · Pandas · PySpark · Apache Airflow · BigQuery
Google Cloud (GCP) · PostgreSQL · REST APIs · Excel / Google Sheets
Für wen das geeignet ist
Finanz- oder Operations-Teams, die in manuellen Berichten versinken
Startups, die eine Datenpipeline brauchen, aber keinen Vollzeit-Engineer
Firmen, die von Excel auf einen richtigen Datenstack umsteigen
Schreib mir vor der Bestellung, ich sage dir ehrlich, ob dein Anwendungsfall passt.
Mein Portfolio
FAQ
Automatische Übersetzung
Welche Informationen benötigen Sie, um loszulegen?
Ich muss deine Datenquellen verstehen (wo die Daten liegen), wie das Ergebnis aussehen soll und wie oft es laufen soll. Eine kurze Erklärung deines aktuellen manuellen Prozesses ist sehr hilfreich — je mehr Kontext du teilst, desto schneller kann ich etwas bauen, das wirklich passt.
Bleibt die Pipeline nach der Lieferung in Betrieb, oder brauche ich einen Entwickler, der sie wartet?
Die Pipelines, die ich liefere, sind so konzipiert, dass sie nach einem Zeitplan ohne manuelles Eingreifen laufen. Ich füge Dokumentation und eine Anleitung bei, damit dein Team sie warten und aktualisieren kann. Für cloud-deployte Lösungen richte ich Überwachung und Alarme ein, damit du sofort weißt, wenn etwas schiefgeht.
Mit welchen Datenquellen können Sie eine Verbindung herstellen?
Excel, CSV, Google Sheets, REST APIs, SQL-Datenbanken (PostgreSQL, MySQL, BigQuery, SQL Server), SAP-Exporte und die meisten Cloud-Speichersysteme (GCP, AWS S3). Wenn du eine spezielle Quelle hast, schreib mir und ich bestätige das vor deiner Bestellung.
Arbeitest du mit vertraulichen Geschäftsdaten?
Ja. Ich arbeite regelmäßig mit sensiblen Finanz- und Betriebsdaten in meiner Firmenarbeit. Ich bin bereit, NDAs zu unterschreiben, und kann bei der Entwicklung auch anonymisierte Musterdaten verwenden, falls nötig.

