Ignoriere "XXX Items Cleaned" in der Paketübersicht, die Pakete werden nach der im Paketbeschrieb angegebenen Dataset-Größe berechnet.
Bereinigtes Dataset:
- Fehler, Inkonsistenzen oder Formatierungsprobleme im Dataset erkennen und korrigieren, um die Genauigkeit und Analysebereitschaft sicherzustellen.
Dataset vorverarbeiten:
- Ähnliche Kategorien zusammenführen
- Datentypen der Spalten ändern
- Unnötige Spalten entfernen
- Feature Engineering basierend auf Analyseziel
- Dataset normalisieren
- Dataset standardisieren
- Maskieren / One-Hot-Encoding
- Ausreißererkennung
- Faktoranalyse durchführen (falls notwendig)