Als Faustregelung können die fehlenden Daten einfach ohne signifikante Auswirkungen gelöscht werden, wenn weniger als 5% der Beobachtungen fehlen (3).
- Wie viel Prozent der fehlenden Daten sind akzeptabel?
- Wie viel fehlende Daten sind für einzelne Imputation akzeptabel?
- Wie gehen Sie mit 50% fehlenden Daten um??
Wie viel Prozent der fehlenden Daten sind akzeptabel?
Wie viele Daten fehlen? Der Gesamtprozentsatz der fehlenden Daten ist wichtig. Wenn weniger als 5% der Werte fehlen, ist es im Allgemeinen akzeptabel, sie zu ignorieren (Ref).
Wie viel fehlende Daten sind für einzelne Imputation akzeptabel?
Scheffer (2002) schlägt vor, dass vollständige Fälle verwendet werden können, wenn nicht mehr als 6% der Daten fehlen, einzeln der Daten fehlen.
Wie gehen Sie mit 50% fehlenden Daten um??
Führen Sie Vorhersagemodelle aus, die die fehlenden Daten lindern. Dies sollte in Verbindung mit einer Art Kreuzvalidierungsschema erfolgen, um Leckagen zu vermeiden. Dies kann sehr effektiv sein und beim endgültigen Modell helfen. Verwenden Sie die Anzahl der fehlenden Werte in einer bestimmten Zeile, um eine neue konstruktive Funktion zu erstellen.