Ich werde ein Python ETL-Skript erstellen, um deine CSV-Daten zu bereinigen, zusammenzuführen und zu konsolidieren

Einige Informationen wurden automatisch übersetzt.

Indien

Ich spreche Englisch, Japanisch, Französisch

1 Auftrag abgeschlossen

Daten und Software

Ich bin ein Python-Dateningenieur, spezialisiert auf ETL-Pipelines, Datenbereinigung und CSV/Excel-Konsolidierung. Ich verwandle unordentliche, inkonsistente Exporte aus mehreren Quellen in einen saub...
Über diesen Service

Hast du Tabellen von verschiedenen Teams, Tools oder Abteilungen, die unterschiedliche Spaltennamen, Datumsformate, doppelte Einträge und schmutzige Werte enthalten? Manuelles Bereinigen und Zusammenführen ist langsam und fehleranfällig. Ich automatisiere das Ganze mit Python + Pandas.

Was ich mache

Ich erstelle einen wiederverwendbaren ETL-Workflow, der:

  • Daten extrahiert aus all deinen CSV/Excel-Dateien in einem Durchlauf
  • Zuordnungen verschiedener Quellspalten in ein einheitliches Schema vornimmt
  • Bereinigt & standardisiert Leerzeichen entfernt, Titel-Schreibung korrigiert, alle Daten in YYYY-MM-DD umwandelt, $/Einheiten entfernt und Beträge & Mengen in saubere Zahlen umwandelt
  • Kategorien standardisiert (z.B. Statuswerte in ein einheitliches Set)
  • Validiert Einträge überprüft und Zeilen ohne erforderliche Felder entfernt
  • Doppelte entfernt, sodass jeder Eintrag nur einmal erscheint
  • Alles zusammenführt in eine einzige, UTF-8-kodierte, reportingfähige Masterdatei

Was du bekommst

  • Ein sauberes, gut dokumentiertes Python-Skript, das du vollständig besitzt
  • Deine konsolidierte Ausgabedatei (CSV/Excel)
  • Eine README mit Installations- und Ausführungsanweisungen
  • Code, der wiederverwendbar ist für die Dateien vom nächsten Monat ohne erneuten Aufwand

Warum ich

  • Experte für Datenengineering & ETL, kein Generalist
  • Sauberer, lesbarer, kommentierter Code (keine Black Boxes)
  • Konsequente, wiederholbare Ergebnisse bei jedem Lauf
  • Schnelle Antworten, pünktlich

Technologie:

Amazon Redshift

Apache-Funken

Excel

MATLAB

Python

Expertise:

Klassifizierung

Datenextraktion

Datenfluss

Mein Portfolio