Saya mencoba memahami keluaran dari analisis komponen utama yang dilakukan sebagai berikut:
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
> res = prcomp(iris[1:4], scale=T)
> res
Standard deviations:
[1] 1.7083611 0.9560494 0.3830886 0.1439265
Rotation:
PC1 PC2 PC3 PC4
Sepal.Length 0.5210659 -0.37741762 0.7195664 0.2612863
Sepal.Width -0.2693474 -0.92329566 -0.2443818 -0.1235096
Petal.Length 0.5804131 -0.02449161 -0.1421264 -0.8014492
Petal.Width 0.5648565 -0.06694199 -0.6342727 0.5235971
>
> summary(res)
Importance of components:
PC1 PC2 PC3 PC4
Standard deviation 1.7084 0.9560 0.38309 0.14393
Proportion of Variance 0.7296 0.2285 0.03669 0.00518
Cumulative Proportion 0.7296 0.9581 0.99482 1.00000
>
Saya cenderung menyimpulkan sebagai berikut dari output di atas:
Proporsi varians menunjukkan berapa banyak total varians yang ada di varian komponen utama tertentu. Oleh karena itu, variabilitas PC1 menjelaskan 73% dari total varians data.
Nilai rotasi yang ditampilkan sama dengan 'memuat' yang disebutkan dalam beberapa deskripsi.
Mempertimbangkan rotasi PC1, orang dapat menyimpulkan bahwa Sepal. Panjang, Petal. Panjang dan Petal. Lebar terkait langsung, dan mereka semua berbanding terbalik dengan Sepal. Lebar (yang memiliki nilai negatif dalam rotasi PC1)
Mungkin ada faktor dalam tanaman (beberapa sistem fungsional kimia / fisik dll) yang dapat mempengaruhi semua variabel ini (Sepal. Panjang, Petal. Panjang dan Petal. Lebar dalam satu arah dan Sepal. Lebar dalam arah yang berlawanan).
Jika saya ingin menunjukkan semua rotasi dalam satu grafik, saya dapat menunjukkan kontribusi relatif mereka terhadap variasi total dengan mengalikan setiap rotasi dengan proporsi varian komponen utama itu. Misalnya, untuk PC1, rotasi 0,52, -0,26, 0,58 dan 0,56 semuanya dikalikan dengan 0,73 (varian proporsional untuk PC1, ditunjukkan dalam ringkasan (res) output.
Apakah saya benar tentang kesimpulan di atas?
Sunting terkait pertanyaan 5: Saya ingin menampilkan semua rotasi dalam barchart sederhana sebagai berikut:
Karena PC2, PC3 dan PC4 memiliki kontribusi variasi yang semakin rendah, akankah masuk akal untuk menyesuaikan (mengurangi) pemuatan variabel di sana?
sumber
Jawaban:
prcomp
dokumentasi , meskipun saya tidak yakin mengapa mereka memberi label bagian ini dari aspek "Rotasi", karena ini menyiratkan pemuatan telah diputar menggunakan beberapa metode ortogonal (mungkin) atau miring (kurang mungkin).ggplot2
, saya yakin ini dilakukan denganalpha
estetika), berdasarkan proporsi varian yang dijelaskan oleh masing-masing komponen (yaitu, warna yang lebih solid = lebih banyak varian yang dijelaskan). Namun, dalam pengalaman saya, angka Anda bukanlah cara yang umum untuk mempresentasikan hasil PCA - Saya pikir satu atau dua tabel (memuat + varian dijelaskan dalam satu, korelasi komponen di yang lain) akan jauh lebih mudah.Referensi
Fabrigar, LR, Wegener, DT, MacCallum, RC, & Strahan, EJ (1999). Mengevaluasi penggunaan analisis faktor eksplorasi dalam penelitian psikologis. Metode Psikologis , 4 , 272-299.
Widaman, KF (2007). Faktor umum versus komponen: Kepala sekolah dan prinsip, kesalahan, dan kesalahpahaman . Dalam R. Cudeck & RC MacCallum (Eds.), Analisis faktor pada 100: Perkembangan bersejarah dan arah masa depan (hal. 177-203). Mahwah, NJ: Lawrence Erlbaum.
sumber
sumber