Ich werde ein Python ETL-Skript erstellen, um deine CSV-Daten zu bereinigen, zusammenzuführen und zu konsolidieren
Daten und Software
Über diesen Service
Hast du Tabellen von verschiedenen Teams, Tools oder Abteilungen, die unterschiedliche Spaltennamen, Datumsformate, doppelte Einträge und schmutzige Werte enthalten? Manuelles Bereinigen und Zusammenführen ist langsam und fehleranfällig. Ich automatisiere das Ganze mit Python + Pandas.
Was ich mache
Ich erstelle einen wiederverwendbaren ETL-Workflow, der:
- Daten extrahiert aus all deinen CSV/Excel-Dateien in einem Durchlauf
- Zuordnungen verschiedener Quellspalten in ein einheitliches Schema vornimmt
- Bereinigt & standardisiert Leerzeichen entfernt, Titel-Schreibung korrigiert, alle Daten in YYYY-MM-DD umwandelt, $/Einheiten entfernt und Beträge & Mengen in saubere Zahlen umwandelt
- Kategorien standardisiert (z.B. Statuswerte in ein einheitliches Set)
- Validiert Einträge überprüft und Zeilen ohne erforderliche Felder entfernt
- Doppelte entfernt, sodass jeder Eintrag nur einmal erscheint
- Alles zusammenführt in eine einzige, UTF-8-kodierte, reportingfähige Masterdatei
Was du bekommst
- Ein sauberes, gut dokumentiertes Python-Skript, das du vollständig besitzt
- Deine konsolidierte Ausgabedatei (CSV/Excel)
- Eine README mit Installations- und Ausführungsanweisungen
- Code, der wiederverwendbar ist für die Dateien vom nächsten Monat ohne erneuten Aufwand
Warum ich
- Experte für Datenengineering & ETL, kein Generalist
- Sauberer, lesbarer, kommentierter Code (keine Black Boxes)
- Konsequente, wiederholbare Ergebnisse bei jedem Lauf
- Schnelle Antworten, pünktlich
Mein Portfolio
FAQ
Automatische Übersetzung
Funktioniert das Skript auch bei den Dateien vom nächsten Monat?
Ja — Standard- und Premium-Pakete liefern ein wiederverwendbares Skript, das mit Dateien mit derselben Struktur umgeht, sodass du es jederzeit ohne Programmieraufwand erneut ausführen kannst.
Haben meine Dateien unterschiedliche Spaltennamen — ist das ein Problem?
Überhaupt nicht. Das Mapping der Felder in ein einheitliches Schema ist ein zentraler Bestandteil des Services.

