Ich bin Data Scientist und Machine Learning Engineer und spezialisiere mich darauf, unordentliche Daten in saubere, handlungsfähige Datensätze zu verwandeln. Ich helfe Unternehmen, Stunden manueller A...
Datenbereinigung & Hygiene: Doppelte Zeilen erkennen und entfernen, null- oder fehlende Werte mit intelligenten Imputationsmethoden behandeln und irrelevante Merkmale eliminieren.
Strukturelle Korrekturen & Formatierung: Daten standardisieren, falsche Datentypen korrigieren (z.B. Textzahlen in Fließkommazahlen umwandeln) und Textstrings mit benutzerdefinierten Regex-Mustern bereinigen.
Datenintegration: Mehrere Tabellen oder unterschiedliche Datenquellen nahtlos zusammenführen, verbinden und zu einem einheitlichen Master-Datensatz konsolidieren.
Fortgeschrittene Vorverarbeitung für ML: Kategorische Kodierung (One-Hot, Label- oder Target-Encoding) durchführen und geeignete Merkmals-Skalierung/Normalisierung (MinMax oder Standard-Scaling) anwenden, optimiert für komplexe prädiktive Architekturen.
Feature Engineering: Neue Interaktionsvariablen erstellen und benutzerdefinierte mathematische Transformationen anwenden, um das Signal in deinen Daten zu maximieren.