Saat membaca tentang PCA, saya menemukan penjelasan berikut:
Misalkan kita memiliki kumpulan data di mana setiap titik data mewakili skor siswa tunggal pada tes matematika, tes fisika, tes membaca pemahaman, dan tes kosa kata.
Kami menemukan dua komponen utama pertama, yang menangkap 90% variabilitas dalam data, dan menginterpretasikan pemuatannya. Kami menyimpulkan bahwa komponen utama pertama mewakili kemampuan akademik secara keseluruhan, dan yang kedua mewakili kontras antara kemampuan kuantitatif dan kemampuan verbal.
Teks menyatakan bahwa PC1 dan PC2 memuat untuk PC1 dan untuk PC2, dan menawarkan penjelasan berikut:( 0,5 , 0,5 , - 0,5 , - 0,5 )
Komponen pertama proporsional dengan skor rata-rata, dan komponen kedua mengukur perbedaan antara pasangan skor pertama dan pasangan skor kedua.
Saya tidak dapat mengerti apa arti penjelasan ini.
Jawaban:
Pemuatan (yang tidak harus dikacaukan dengan vektor eigen) memiliki properti berikut:
Anda mengekstraksi 2 PC pertama dari 4. Matriks memuat dan nilai eigen:SEBUAH
Dalam hal ini, kedua nilai eigen itu sama. Ini adalah kasus yang jarang terjadi di dunia nyata, dikatakan bahwa PC1 dan PC2 memiliki "kekuatan" penjelas yang sama.
Misalkan Anda juga menghitung nilai komponen,C X^= C A′ SEBUAH X^
Nx2
matriks , dan Anda terstandarisasi-z (rata-rata = 0, st. Dev. = 1) di dalam setiap kolom. Kemudian (sebagai titik 2 di atas mengatakan), X = C A ' . Tapi, karena Anda hanya tersisa 2 PC dari 4 (Anda kurang 2 kolom lebih banyak di A ) nilai-nilai data yang dipulihkan X tidak tepat, - ada kesalahan (jika nilai eigen 3, 4 tidak nol).BAIK. Apa koefisien untuk memprediksi komponen berdasarkan variabel ? Jelas, jika penuh , ini akan menjadi B = ( A - 1 ) ′ . Dengan matriks pemuatan non-kuadrat, kita dapat menghitungnya sebagai B = A ⋅ d i a g ( e i g e n v a l u e s ) - 1 = ( A + ) ′ , di manaSEBUAH B = ( A- 1)′ B = A ⋅ d i a g ( e i g e n v a l u e s )- 1= ( A+)′
4x4
diag(eigenvalues)
adalah matriks diagonal persegi dengan nilai eigen pada diagonalnya, dan+
superscript menunjukkan pseudoinverse. Dalam kasus Anda:Jadi, jika adalah matriks dari variabel berpusat asli (atau variabel standar, jika Anda melakukan PCA berdasarkan korelasi daripada kovarian), maka C = X B ; C adalah skor komponen utama standar. Yang dalam contoh Anda adalah:X C = X B C
Nx4
Jawaban saya yang terkait:
Lebih rinci tentang memuat vs vektor eigen .
Bagaimana skor komponen utama dan skor faktor dihitung .
sumber