Analisis korelasi kanonik (CCA) bertujuan untuk memaksimalkan korelasi product-moment Pearson yang biasa (yaitu koefisien korelasi linier) dari kombinasi linear dari dua set data.
Sekarang, pertimbangkan fakta bahwa koefisien korelasi ini hanya mengukur asosiasi linier - ini adalah alasan mengapa kami juga menggunakan, misalnya, koefisien korelasi Spearman- atau Kendall- τ yang mengukur hubungan monoton (tidak harus linier) yang sewenang-wenang antara variabel.
Oleh karena itu, saya memikirkan hal berikut: satu batasan CCA adalah CCA hanya mencoba menangkap hubungan linier antara kombinasi linear yang terbentuk karena fungsi objektifnya. Tidak akan mungkin untuk memperpanjang CCA dalam arti dengan memaksimalkan, mengatakan, Spearman- bukan Pearson- r ?
Akankah prosedur seperti itu mengarah pada sesuatu yang dapat ditafsirkan secara statistik dan bermakna? (Apakah masuk akal - misalnya - untuk melakukan CCA pada peringkat ...?) Saya bertanya-tanya apakah itu akan membantu ketika kita berurusan dengan data yang tidak normal ...
sumber
Jawaban:
Saya menggunakan ekspansi spline kubik terbatas ketika menghitung varian kanonik. Anda menambahkan fungsi nonlinear basis ke analisis persis seperti Anda akan menambahkan fitur baru. Ini menghasilkan analisis komponen utama nonlinear. Lihat R
Hmisc
paket 'stranscan
fungsi untuk contoh.homals
Paket R mengambil ini lebih jauh.sumber
Metode standar CCA bekerja dengan matriks koefisien korelasi momen produk. Untuk mgnitude CC terbesar, ia membangun dua variabel komposit z1 (n) dan z2 (n) dengan kombinasi linear dua matix (dengan n rows dan variabel m1 dan m2) sedemikian sehingga abs (korelasi (z1, z2)) dimaksimalkan. Fungsi obyektif ini dapat dimaksimalkan secara langsung bahkan jika korelasi (z1, z2) bukan momen produk tetapi didefinisikan secara berbeda.
Mishra, SK (2009) "Catatan tentang Analisis Korelasi Canonical Ordinal dari Dua Set Skor Peringkat"
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319
sumber