- Wie viel Varianz sollte PCA erklären?
- Was ist eine hohe Belastung in PCA?
- Soll ich hochkorrelierte Funktionen vor PCA entfernen?
- Was sagen uns die Ladungen einer PCA??
Wie viel Varianz sollte PCA erklären?
Einige Kriterien besagen, dass die Gesamtvarianz, die von allen Komponenten erklärt wird, zwischen 70% und 80% liegen sollte, was in diesem Fall etwa vier bis fünf Komponenten bedeuten würde.
Was ist eine hohe Belastung in PCA?
Die Ladungen stammen aus numerischer Sicht, gleich den Koeffizienten der Variablen, und geben Informationen darüber, welche Variablen den größten Beitrag zu den Komponenten leisten. Die Ladungen reichen von -1 bis 1. Ein hoher absoluter Wert (zu 1 oder -1) beschreibt, dass die Variable die Komponente stark beeinflusst.
Soll ich hochkorrelierte Funktionen vor PCA entfernen?
Hallo Yong, PCA ist eine Möglichkeit, mit stark korrelierten Variablen umzugehen, sodass sie nicht entfernen müssen. Wenn n Variablen stark korreliert sind, laden sie alle in derselben Hauptkomponente (Eigenvektor) aus, nicht unterschiedliche. So identifizieren Sie sie als stark korreliert.
Was sagen uns die Ladungen einer PCA??
Positive Belastungen zeigen eine Variable an und eine Hauptkomponente sind positiv korreliert: Eine Erhöhung eines Eins führt zu einer Erhöhung des anderen. Negative Belastungen zeigen eine negative Korrelation an. Große (entweder positive oder negative) Belastungen zeigen, dass eine Variable einen starken Einfluss auf diese Hauptkomponente hat.