Ich automatisiere deine Datenextraktion und CSV-Reinigung mit Python
Dateningenieur
Über diesen Service
Hi, ich bin César. Ich bin Ingenieur mit über 3 Jahren Erfahrung im Aufbau von Datensystemen und der Automatisierung von Workflows für Kunden aus Regierung und Infrastruktur.
Ich nutze nicht nur einfache Scraper-Tools; ich schreibe individuelle Python-Skripte, um komplexe Datenprobleme zu lösen. Als Beispiel: In einem kürzlichen Projekt habe ich ein Skript geschrieben, das Kontaktdaten aus über 1.000 unstrukturierten rechtlichen PDFs in weniger als 4 Minuten extrahiert hat – eine Aufgabe, die zuvor ein Team von über 60 Stunden manuell erledigen musste.
Hier ist, was ich für dich bauen kann:
- Individuelle Datenerfassung: Saubere Daten von Websites ziehen, auch wenn sie Login, Paginierung oder dynamisches JavaScript haben.
- Datenbereinigung & Formatierung: Deine unordentlichen CSVs, Excel-Dateien oder PDFs nehmen und mit Pandas filtern, deduplizieren und genau so formatieren, wie du es brauchst.
- ETL-Pipelines: Rohe Daten von jeder Quelle in saubere, strukturierte Ausgaben (CSV, JSON, SQL) umwandeln.
- Automatisierte Skripte: Ich liefere dir den vollständig dokumentierten Python-Quellcode, damit du die Extraktion jederzeit selbst durchführen kannst.
Jedes Skript, das ich liefere, ist modular, umfangreich kommentiert und so gebaut, dass es Fehler abfängt, ohne abzustürzen.
Wichtig: Bitte schick mir vor der Bestellung eine kurze Nachricht mit deiner Ziel-URL oder einer Beispiel-Datei damit ich den Umfang abschätzen kann.
Technologie:
Excel
•
Google Sheets
•
Python
•
Zapier
FAQ
Automatische Übersetzung
Mit welchen Dateiformaten können Sie arbeiten?
Ich kann CSV, Excel (.xlsx/.xls), JSON, PDF, Word (.docx) und Daten von Websites oder APIs verarbeiten. Wenn du ein anderes Format hast, schreib mir — ich sage dir, ob ich es bearbeiten kann.
Bekomme ich das Python-Skript oder nur die gereinigten Daten?
Das Basic-Paket liefert nur die gereinigte Ausgabe. Die Pakete Standard und Premium beinhalten den dokumentierten Quellcode, damit du die Automatisierung jederzeit selbst wieder ausführen kannst.
Wie groß kann mein Datensatz sein?
Basic verarbeitet bis zu 500 Zeilen. Standard bis zu 5000 Zeilen. Für größere Datensätze über 5000 Zeilen oder mit Datenbankintegration wähle Premium oder frag mich nach einem individuellen Angebot.

