Pada penggunaan rotasi miring setelah PCA

9

Beberapa paket statistik, seperti SAS, SPSS, dan R, memungkinkan Anda untuk melakukan semacam rotasi faktor setelah PCA.

  1. Mengapa rotasi diperlukan setelah PCA?
  2. Mengapa Anda menerapkan rotasi miring setelah PCA mengingat bahwa tujuan PCA adalah untuk menghasilkan dimensi ortogonal?
pbneau
sumber
Saya mengajukan pertanyaan yang menggambarkan perlunya rotasi faktor setelah PCA karena PCA memberikan hasil yang bias. Lihat stats.stackexchange.com/questions/6575/…
mbaitoff

Jawaban:

8

Saya pikir ada pendapat atau pandangan yang berbeda tentang PCA, tetapi pada dasarnya kita sering menganggapnya sebagai teknik reduksi (Anda mengurangi ruang fitur Anda menjadi lebih kecil, seringkali jauh lebih "mudah dibaca" asalkan Anda mengurus pemusatan / standardisasi yang tepat. data ketika dibutuhkan) atau cara untuk membangun faktor latenatau dimensi yang merupakan bagian penting dari dispersi antar-individu (di sini, "individu" adalah unit statistik tempat pengumpulan data; ini mungkin negara, orang, dll.). Dalam kedua kasus, kami membangun kombinasi linear dari variabel asli yang memperhitungkan varians maksimum (ketika diproyeksikan pada sumbu utama), tunduk pada kendala ortogonalitas antara dua komponen utama. Sekarang, apa yang telah dijelaskan adalah murni aljabar atau matematis dan kami tidak menganggapnya sebagai model (menghasilkan), bertentangan dengan apa yang dilakukan dalam tradisi analisis faktor di mana kami menyertakan istilah kesalahan untuk menjelaskan beberapa jenis kesalahan pengukuran . Saya juga menyukai pengantar yang diberikan oleh William Revelle dalam bukunya yang akan datang tentang psikometri terapan menggunakan R (Bab 6), jika kita ingin menganalisis struktur matriks korelasi, maka

[Pendekatan, PCA] pertama adalah model yang mendekati matriks korelasi dalam hal produk komponen di mana setiap komponen merupakan jumlah linear tertimbang dari variabel, model kedua [analisis faktor] juga merupakan perkiraan matriks korelasi dengan produk dari dua faktor, tetapi faktor-faktor dalam hal ini dipandang sebagai penyebab dan bukan sebagai konsekuensi dari variabel.

Dengan kata lain, dengan PCA Anda mengekspresikan setiap komponen (faktor) sebagai kombinasi linear dari variabel sedangkan di FA ini adalah variabel yang dinyatakan sebagai kombinasi linear dari faktor-faktor. Diakui dengan baik bahwa kedua metode umumnya akan menghasilkan hasil yang sangat mirip (lihat misalnya Harman, 1976 atau Catell, 1978), terutama dalam kasus "ideal" di mana kami memiliki sejumlah besar individu dan faktor rasio yang baik: variabel (biasanya bervariasi antara 2 dan 10 tergantung pada penulis yang Anda pertimbangkan!). Ini karena, dengan memperkirakan diagonal dalam matriks korelasi (seperti yang dilakukan dalam FA, dan elemen-elemen ini dikenal sebagai komunitas), varians kesalahan dihilangkan dari matriks faktor. Inilah alasan mengapa PCA sering digunakan sebagai cara untuk mengungkap faktor laten atau konstruk psikologis menggantikan FA yang dikembangkan pada abad terakhir. Tetapi, ketika kita melanjutkan hal ini, kita sering ingin mencapai interpretasi yang lebih mudah dari struktur faktor yang dihasilkan (atau yang disebut matriks pola). Dan kemudian muncul trik yang berguna untuk memutar sumbu faktorial sehingga kami memaksimalkan pemuatan variabel pada faktor tertentu, atau setara mencapai "struktur sederhana". Menggunakan rotasi ortogonal (misalnya VARIMAX), kami menjaga independensi faktor. Dengan rotasi miring (mis. OBLIMIN, PROMAX), kami mematahkannya dan faktor-faktor diizinkan untuk berkorelasi. Ini telah banyak diperdebatkan dalam literatur, dan telah menyebabkan beberapa penulis (bukan psikometri, tetapi ahli statistik di awal 1960-an).

Tetapi intinya adalah bahwa metode rotasi pada awalnya dikembangkan dalam konteks pendekatan FA dan sekarang secara rutin digunakan dengan PCA. Saya tidak berpikir ini bertentangan dengan perhitungan algoritmik dari komponen utama: Anda dapat memutar sumbu faktorial seperti yang Anda inginkan, asalkan Anda ingat bahwa setelah berkorelasi (dengan rotasi miring) interpretasi ruang faktorial menjadi kurang jelas.

PCA secara rutin digunakan ketika mengembangkan kuesioner baru, meskipun FA mungkin merupakan pendekatan yang lebih baik dalam kasus ini karena kami mencoba untuk mengekstraksi faktor-faktor bermakna yang memperhitungkan kesalahan pengukuran akun dan yang hubungannya dapat dipelajari sendiri (misalnya dengan memperhitungkan pola yang dihasilkan matriks, kita mendapatkan model faktor orde kedua). Tetapi PCA juga digunakan untuk memeriksa struktur faktorial yang sudah divalidasi. Para peneliti tidak terlalu peduli dengan FA vs PCA ketika mereka memilikinya, katakanlah 500 subjek representatif yang diminta untuk menilai kuesioner 60 item yang menangani lima dimensi (ini adalah kasus NEO-FFI, misalnya), dan saya pikir mereka benar karena dalam kasus ini kami tidak terlalu tertarik untuk mengidentifikasi model pembangkit atau konseptual (istilah "perwakilan" digunakan di sini untuk mengurangi masalah invariansi pengukuran ).

Sekarang, tentang pilihan metode rotasi dan mengapa beberapa penulis menentang keras penggunaan rotasi ortogonal, saya ingin mengutip Paul Kline, seperti yang saya lakukan dalam menanggapi pertanyaan berikut, FA: Memilih matriks Rotasi, berdasarkan “Struktur Sederhana Kriteria ” ,

(...) di dunia nyata, tidak masuk akal untuk berpikir bahwa faktor-faktor, sebagai penentu perilaku yang penting, akan berkorelasi. - P. Kline, Kecerdasan. The Psychometric View , 1991, hlm. 19

Dengan demikian saya akan menyimpulkan bahwa, tergantung pada tujuan penelitian Anda (apakah Anda ingin menyoroti pola utama matriks korelasi Anda atau apakah Anda ingin memberikan interpretasi yang masuk akal tentang mekanisme yang mendasari yang mungkin menyebabkan Anda mengamati matriks korelasi seperti itu) ), Anda bebas memilih metode yang paling tepat: Ini tidak harus dilakukan dengan konstruksi kombinasi linier, tetapi hanya pada cara Anda ingin menafsirkan ruang faktorial yang dihasilkan.

Referensi

  1. Harman, HH (1976). Analisis Faktor Modern . Chicago, University of Chicago Press.
  2. Cattell, RB (1978). Penggunaan Ilmiah Analisis Faktor . New York, Plenum.
  3. Kline, P. (1991). Intelijen. Pandangan Psikometrik . Rutekan.
chl
sumber
4

Masalah dengan dimensi ortogonal adalah bahwa komponen-komponennya tidak dapat diinterpretasikan. Jadi, sementara rotasi miring (yaitu, dimensi nonorthogonal) secara teknis kurang memuaskan rotasi seperti itu kadang-kadang meningkatkan interpretabilitas komponen yang dihasilkan.


sumber
4

Poin Dasar

  • Rotasi dapat membuat interpretasi komponen lebih jelas
  • Rotasi miring sering lebih masuk akal secara teoritis. Yaitu, variabel yang diamati dapat dijelaskan dalam hal jumlah komponen berkorelasi yang lebih kecil.

Contoh

  • 10 tes semua mengukur kemampuan dengan beberapa mengukur kemampuan verbal dan beberapa mengukur spasial. Semua tes saling terkait, tetapi interkorelasi dalam tes verbal atau spasial lebih besar daripada lintas tipe tes. PCA pelit mungkin melibatkan dua komponen berkorelasi, verbal dan spasial. Teori dan penelitian menunjukkan bahwa kedua kemampuan ini berkorelasi. Dengan demikian, rotasi miring masuk akal secara teoritis.
Jeromy Anglim
sumber