Misalkan saya memiliki dataset titik 2D dan saya ingin mendeteksi arah semua maxima lokal dari varians dalam data, misalnya:
PCA tidak membantu dalam situasi ini karena merupakan dekomposisi ortogonal dan oleh karena itu tidak dapat mendeteksi kedua garis yang saya indikasikan dengan warna biru, tetapi outputnya mungkin terlihat seperti yang ditunjukkan oleh garis hijau.
Harap rekomendasikan teknik apa pun yang mungkin cocok untuk tujuan ini. Terima kasih.
Jawaban:
Analisis Komponen Independen harus dapat memberikan Anda solusi yang baik. Ini dapat menguraikan komponen non-ortogonal (seperti dalam kasus Anda) dengan mengasumsikan bahwa hasil pengukuran Anda dari campuran variabel independen secara statistik.
Ada banyak tutorial bagus di Internet, dan hening beberapa implementasi yang tersedia secara gratis untuk dicoba (misalnya dalam scikit atau MDP ).
Kapan ICA tidak berfungsi?
Seperti algoritma lainnya, ICA optimal ketika asumsi yang diturunkannya berlaku. Secara konkret,
ICA mengembalikan estimasi matriks pencampuran dan komponen independen.
Ketika sumber Anda Gaussian maka ICA tidak dapat menemukan komponen. Bayangkan Anda memiliki dua komponen independen, dan , yaitu . Kemudian, x 2 N ( 0 , I ) p ( x 1 , x 2 ) = p ( x 1 ) p ( x 2 ) = 1x1 x2 N( 0 , saya)
dimana. adalah norma dari vektor dua dimensi. Jika mereka dicampur dengan transformasi ortogonal (misalnya rotasi ), kita memiliki,, yang berarti bahwa distribusi probabilitas tidak berubah di bawah rotasi. Oleh karena itu, ICA tidak dapat menemukan matriks pencampuran dari data.| | . | | R | | R x | | = | | x | |
sumber
Ada prosedur mirip PCA untuk kasus yang disebut "miring". Dalam stat-software seperti SPSS (dan mungkin juga dalam klon freeware-nya) PSPP orang menemukan yang setara disebut "rotasi miring", dan contoh dari mereka bernama "oblimin", "promax" dan sesuatu yang lebih. Jika saya memahami hal-hal dengan benar, perangkat lunak ini mencoba untuk "meluruskan" pemuatan faktor dengan menghitung ulang koordinatnya dalam ruang ortogonal, euclidean (seperti misalnya yang ditunjukkan pada gambar Anda) menjadi koordinat ruang yang kapaknya non-ortogonal mungkin dengan beberapa teknik diketahui dari regresi berganda. Selain itu saya pikir ini hanya berfungsi berulang dan mengkonsumsi satu atau lebih derajat kebebasan dalam pengujian statistik model.
perbandingan PCA dan rotasi miring
Buku pedoman referensi SPSS (di situs IBM) untuk rotasi miring berisi rumus-rumus genap untuk perhitungannya.
[Perbarui] (Upps, maaf, baru saja memeriksa bahwa PSPP tidak menyediakan "rotasi" dari jenis miring)
sumber
Saya tidak punya banyak pengalaman dengan itu, tetapi Vidal, Ma, dan Sastry's Generalized PCA dibuat untuk masalah yang sangat mirip.
sumber
Jawaban lain telah memberikan beberapa petunjuk berguna tentang teknik yang dapat Anda pertimbangkan, tetapi tampaknya tidak ada yang menunjukkan bahwa asumsi Anda salah: garis yang diperlihatkan dengan warna biru pada gambar skematik Anda BUKAN maksimum lokal dari varian.
sumber