Sejauh yang saya mengerti, komponen utama diperoleh dengan memutar sumbu koordinat untuk menyelaraskannya dengan arah varian maksimum.
Namun demikian, saya terus membaca tentang "komponen utama yang tidak diputar" dan perangkat lunak statistik saya (SAS) memberi saya komponen utama yang diputar-varimax serta komponen yang tidak diputar. Di sini saya bingung: ketika kita menghitung komponen utama, sumbu sudah diputar; jadi mengapa diperlukan rotasi lain? Dan apa yang dimaksud dengan "komponen utama yang tidak diputar" artinya?
pca
terminology
factor-rotation
Srewashi Lahiri
sumber
sumber
Jawaban:
Ini akan menjadi jawaban non-teknis.
Anda benar: PCA pada dasarnya adalah rotasi sumbu koordinat, dipilih sedemikian rupa sehingga setiap sumbu yang berhasil menangkap varian sebanyak mungkin.
Dalam beberapa disiplin ilmu (seperti misalnya psikologi), orang suka menerapkan PCA untuk menafsirkan sumbu yang dihasilkan. Yaitu mereka ingin dapat mengatakan bahwa sumbu utama # 1 (yang merupakan kombinasi linear dari variabel asli) memiliki beberapa makna tertentu. Untuk menebak makna ini, mereka akan melihat bobot dalam kombinasi linier. Namun, bobot ini sering berantakan dan tidak ada makna yang jelas yang bisa dilihat.
Dalam kasus ini, orang kadang-kadang memilih untuk bermain-main sedikit dengan solusi PCA vanilla. Mereka mengambil sejumlah sumbu utama (yang dianggap "signifikan" oleh beberapa kriteria), dan juga memutarnya, mencoba mencapai beberapa "struktur sederhana" --- yaitu, kombinasi linear yang akan lebih mudah untuk ditafsirkan. Ada algoritma spesifik yang mencari struktur paling sederhana yang mungkin; salah satunya disebut varimax. Setelah rotasi varimax, komponen berturut-turut tidak lagi menangkap varian sebanyak mungkin! Fitur PCA ini rusak dengan melakukan rotasi varimax tambahan (atau lainnya).
Jadi sebelum menerapkan rotasi varimax, Anda memiliki komponen utama "tidak diputar". Dan setelah itu, Anda mendapatkan komponen utama yang "diputar". Dengan kata lain, terminologi ini mengacu pada post-processing hasil PCA dan bukan ke rotasi PCA itu sendiri.
Semua ini agak rumit oleh fakta bahwa apa yang diputar adalah memuat dan bukan sumbu utama. Namun, untuk perincian matematis, saya merujuk Anda (dan pembaca yang tertarik) ke jawaban panjang saya di sini: Apakah PCA diikuti oleh rotasi (seperti varimax) masih PCA?
sumber
what gets rotated are loadings and not principal axes as such
Saya akan menambahkan bahwa ini adalah gagasan teknis. Secara teoritis, kedua jenis rotasi ini disandingkan. Dalam PCA kami memutar untuk menemukan basis ortogonal spesifik (yang dengan plot scree-nilai eigen yang paling curam). Dalam varimax, kami memutar untuk menemukan basis ortogonal spesifik lain (dengan struktur yang paling saling-dapat-antar). Kita bisa melakukan segala macam dasar ortogonal.