- Können Sie eine Regression mit fehlenden Daten ausführen??
- Wie gehen Sie mit fehlenden Daten in der Regression um??
- Wie viel fehlende Daten sind für die Regression akzeptabel?
Können Sie eine Regression mit fehlenden Daten ausführen??
Bei der Regressionsanalyse besteht der Standard in allen Programmen darin, Fälle mit fehlenden Daten in einer der Variablen zu beseitigen (i.e., Löschung listen). Mit zunehmender Datenmenge kann eine erhebliche Verringerung der Stichprobengröße und einen daraus resultierenden Leistungsverlust bestehen.
Wie gehen Sie mit fehlenden Daten in der Regression um??
Bei der Behandlung fehlender Daten können Datenwissenschaftler zwei primäre Methoden verwenden, um den Fehler zu lösen: Imputation oder die Entfernung von Daten. Die Imputationsmethode entwickelt angemessene Vermutungen für fehlende Daten. Es ist am nützlichsten, wenn der Prozentsatz der fehlenden Daten niedrig ist.
Wie viel fehlende Daten sind für die Regression akzeptabel?
Statistische Leitfadenartikel haben angegeben, dass die Verzerrung wahrscheinlich in Analysen mit mehr als 10% Fehlern ist und dass, wenn mehr als 40% Daten in wichtigen Variablen fehlen, nur als Hypothesegenerierung angesehen werden sollten [18] [19].