Apakah mungkin untuk menggunakan analisis komponen utama kernel (kPCA) untuk Latent Semantic Indexing (LSI) dengan cara yang sama seperti PCA digunakan?
Saya melakukan LSI dalam R menggunakan prcomp
fungsi PCA dan mengekstrak fitur dengan memuat tertinggi dari komponen pertama . Dengan itu saya mendapatkan fitur yang menggambarkan komponen terbaik.
Saya mencoba menggunakan kpca
fungsi (dari kernlib
paket) tetapi tidak dapat melihat cara mengakses bobot fitur ke komponen utama. Apakah ini mungkin secara keseluruhan saat menggunakan metode kernel?
r
pca
feature-selection
kernel-trick
pengguna3683
sumber
sumber
Jawaban:
Saya pikir jawaban atas pertanyaan Anda negatif: itu tidak mungkin.
PCA standar dapat digunakan untuk pemilihan fitur, karena setiap komponen utama adalah kombinasi linier dari fitur asli, sehingga orang dapat melihat fitur asli mana yang paling berkontribusi terhadap komponen utama yang paling menonjol, lihat misalnya di sini: Menggunakan analisis komponen utama (PCA) untuk pemilihan fitur .
Tetapi dalam kernel PCA setiap komponen utama adalah kombinasi linear dari fitur-fitur di ruang target , dan untuk misalnya kernel Gaussian (yang sering digunakan) ruang target adalah dimensi tak terbatas. Jadi konsep "memuat" tidak benar-benar masuk akal untuk kPCA, dan pada kenyataannya, komponen utama kernel dihitung secara langsung, melewati perhitungan sumbu utama (yang untuk PCA standar diberikan dalam R oleh
prcomp$rotation
) secara keseluruhan, berkat apa yang dikenal sebagai trik kernel . Lihat misalnya di sini: Apakah Kernel PCA dengan kernel linier setara dengan PCA standar? untuk lebih jelasnya.Jadi tidak, itu tidak mungkin. Setidaknya tidak ada cara mudah.
sumber
Contoh berikut (diambil dari manual referensi kernlab) memperlihatkan kepada Anda cara mengakses berbagai komponen PCA kernel:
Apakah ini menjawab pertanyaan Anda?
sumber