Mengapa skor komponen utama tidak berkorelasi?

9

Anggaplah adalah matriks data yang berpusat pada rata-rata. Matriks S = cov ( A ) adalah m × m , memiliki m nilai eigen yang berbeda, dan vektor eigen s 1 , s 2 ... s m , yang ortogonal.SEBUAHS=cov(SEBUAH)m×mms1s2sm

The -th komponen utama (beberapa orang menyebutnya "nilai") adalah vektor z i = A s i . Dengan kata lain, itu kombinasi linear dari kolom A , di mana koefisien komponen i -th eigen dari S .sayazsaya=SEBUAHssayaSEBUAHsayaS

Saya tidak mengerti mengapa dan z j ternyata tidak berkorelasi untuk semua i j . Apakah ini mengikuti fakta bahwa s i dan s j adalah ortogonal? Tentunya tidak, karena saya dapat dengan mudah menemukan matriks B dan sepasang vektor ortogonal x , y sedemikian rupa sehingga B x dan B y berkorelasi.zsayazjsayajssayasjBx,yBxBy

Ernest A
sumber

Jawaban:

7

zsayazj=(SEBUAHssaya)(SEBUAHsj)=ssayaSEBUAHSEBUAHsj=(n-1)ssayaSsj=(n-1)ssayaλjsj=(n-1)λjssayasj=0.
amuba
sumber
1
Matematika: bahasa yang sangat indah.
Néstor
4
Ini berarti dan z j adalah ortogonal. Tidak berkorelasi artinya ini pasti benar: ( z i - ˉ z i ) ( z j - ˉ z j ) = 0 . Saya kira entah bagaimana ˉ z i = ˉ z j = 0 , dan kemudian z i z j = 0 juga menyiratkan bahwa mereka tidak berkorelasi. zsayazj(zsaya-z¯saya)(zj-z¯j)=0z¯saya=z¯j=0zsayazj=0
Ernest A
2
Poin bagus, @Ernest. Berarti memang nol, karena data telah berpusat pada rata-rata (sesuai asumsi Anda). Maka semua proyeksi harus memiliki nol.
amoeba
2
@Jubbles karena , karenaAA=(n-1)S. S=cov(SEBUAH)=1n-1SEBUAHSEBUAHSEBUAHSEBUAH=(n-1)S
Ernest A
2
@Ernest, saya tidak bisa menahan diri untuk tidak memberikan jawaban yang tidak mengandung teks, tapi mungkin saya harus menambahkan bahwa alasan mendasar mengapa PC tidak berkorelasi adalah karena matriks kovariansnya diberikan oleh dalam basis vektor eigen, dan dalam basis ini S menjadi diagonal - - itulah inti dari komposisi eigend. SS
amoeba