Apakah mungkin untuk memvisualisasikan output dari Analisis Komponen Utama dengan cara yang memberikan wawasan lebih dari sekadar tabel ringkasan? Apakah mungkin untuk melakukannya ketika jumlah pengamatan besar, katakan ~ 1e4? Dan mungkinkah melakukannya di R [lingkungan lain diterima]?
r
data-visualization
pca
biplot
gappy
sumber
sumber
Jawaban:
The biplot adalah alat yang berguna untuk memvisualisasikan hasil PCA. Ini memungkinkan Anda untuk memvisualisasikan skor komponen utama dan arah secara bersamaan. Dengan 10.000 pengamatan Anda mungkin akan mengalami masalah dengan plot yang berlebihan. Alpha blending bisa membantu di sana.
Berikut ini adalah data biplot PC dari data anggur dari repositori UCI ML :
Poin sesuai dengan skor PC1 dan PC2 dari setiap pengamatan. Panah mewakili korelasi variabel dengan PC1 dan PC2. Lingkaran putih menunjukkan batas maksimum teoritis panah. Elips adalah data elips 68% untuk masing-masing dari 3 varietas anggur dalam data.
Saya telah membuat kode untuk membuat plot ini tersedia di sini .
sumber
Plot Wachter dapat membantu Anda memvisualisasikan nilai eigen PCA Anda. Ini pada dasarnya adalah plot QQ dari nilai eigen terhadap distribusi Marchenko-Pastur. Saya punya contoh di sini: Ada satu nilai eigen dominan yang berada di luar distribusi Marchenko-Pastur. Kegunaan plot semacam ini tergantung pada aplikasi Anda.
sumber
Anda juga bisa menggunakan paket psikis.
Ini berisi metode plot.factor, yang akan memplot komponen yang berbeda satu sama lain dalam gaya matriks sebar.
sumber