Welche Merkmale haben das größte Gewicht? Wie tragen Originalmerkmale zu Hauptkomponenten bei? Diese 5 Visualisierungstypen geben die Antwort.
Die Hauptkomponentenanalyse (PCA) kann Ihnen viel über Ihre Daten verraten. Kurz gesagt handelt es sich dabei um eine Technik zur Dimensionsreduzierung, mit der hochdimensionale Datensätze in einen visualisierbaren Raum gebracht werden.
Aber ich gehe davon aus, dass Sie das bereits wissen. Wenn nicht, überprüfen Sie meine Anleitung von Grund auf.
Heute geht es nur um die visuellen Elemente. Am Ende des Artikels wissen Sie, wie Sie Folgendes erstellen und interpretieren:
- Diagramm der erklärten Varianz
- Diagramm der kumulativ erklärten Varianz
- 2D/3D-Komponentenstreudiagramm
- Attribut-Biplot
- Punktediagramm wird geladen
Ich würde mich gerne gleich in Visualisierungen vertiefen, aber Sie benötigen Daten, um mitmachen zu können. Dieser Abschnitt behandelt das Laden von Daten, die Vorverarbeitung, die PCA-Anpassung und allgemeine Stilanpassungen von Matplotlib.