Membaca Wikipedia tentang analisis korelasi kanonik (CCA) untuk dua vektor acak dan , saya bertanya-tanya apakah komponen utama analisis (PCA) sama dengan CCA ketika ?Y X = Y
9
Membaca Wikipedia tentang analisis korelasi kanonik (CCA) untuk dua vektor acak dan , saya bertanya-tanya apakah komponen utama analisis (PCA) sama dengan CCA ketika ?Y X = Y
vectors X and Y
Apakah itu dua variabel (kolom data) atau dua kasus (baris); mengingat bahwa kita akan melakukan analisis variabel. 2)X and Y are the same
Apakah Anda ingin mengatakan bahwa X = Y atau sebaliknya?Jawaban:
Biarkan menjadi dan menjadi matriks data, mewakili dua kumpulan data dengan sampel (yaitu pengamatan vektor baris acak Anda dan ) di masing-masingnya.n × p 1 Y n × p 2 n X YX n×p1 Y n×p2 n X Y
CCA mencari kombinasi linear dari variabel dalam dan kombinasi linear dari variabel di sedemikian sehingga mereka berkorelasi secara maksimal antara satu sama lain; kemudian mencari pasangan berikutnya, di bawah batasan nol korelasi dengan pasangan pertama; dll. X p 2 Yp1 X p2 Y
Dalam kasus (dan ), setiap kombinasi linear dalam satu dataset secara sepele akan memiliki korelasi dengan kombinasi linear yang sama dengan kombinasi linear yang sama dalam dataset lain. Jadi semua pasangan CCA akan memiliki korelasi , dan urutan pasangan berubah-ubah. Satu-satunya kendala yang tersisa adalah bahwa kombinasi linier harus saling berkorelasi satu sama lain. Ada banyak cara untuk memilih kombinasi linear tidak berkorelasi (perhatikan bahwa bobot tidak harus ortogonal dalam ruang dimensi) dan salah satunya akan menghasilkan solusi CCA yang valid. Salah satu cara tersebut memang diberikan oleh PCA, karena setiap dua PC memiliki korelasi nol.p 1 = p 2 = p 1 1 p pX=Y p1=p2=p 1 1 p p
Jadi solusi PCA memang akan menjadi solusi CCA yang valid, tetapi ada jumlah tak terbatas solusi CCA yang setara dalam hal ini.
Secara matematis, CCA mencari kanan ( ) dan kiri ( ) vektor tunggal dari , yang dalam hal ini sama dengan , dengan vektor apa saja yang merupakan vektor eigen. Jadi bisa berubah-ubah. CCA kemudian mendapatkan bobot kombinasi linear sebagai dan . Dalam hal ini ia bermuara pada mengambil dasar yang sewenang-wenang dan mengubahnya dengan , yang memang akan menghasilkan arah yang tidak berkorelasi .b C - 1 / 2 X X C X Y C - 1 / 2 Y Y saya a = b C - 1 / 2 X X a C - 1 / 2 Y Y b C - 1 / 2 X Xa b C−1/2XXCXYC−1/2YY I a=b C−1/2XXa C−1/2YYb C−1/2XX
sumber