Saya ingin melakukan analisis komponen utama (analisis faktor) pada SPSS berdasarkan 22 variabel. Namun, beberapa variabel saya sangat miring (skewness dihitung dari SPSS berkisar 2-80!).
Jadi inilah pertanyaanku:
Haruskah saya menjaga variabel miring seperti itu atau saya bisa mengubah variabel pada analisis komponen utama? Jika ya, bagaimana saya menafsirkan skor faktor?
Jenis transformasi apa yang harus saya lakukan? log10 atau ln?
Awalnya, KMO saya (Kaiser – Meyer – Olkin) adalah 0,413. Banyak literatur merekomendasikan minimal 0,5. Bisakah saya masih melakukan analisis faktor, atau apakah saya perlu menghapus variabel untuk meningkatkan KMO saya menjadi 0,5?
Jawaban:
Masalah kemiringan dalam PCA sama dengan dalam regresi: ekor yang lebih panjang, jika itu benar-benar relatif panjang terhadap seluruh jajaran distribusi, sebenarnya berperilaku seperti pencilan besar — itu menarik garis pas (komponen utama dalam kasus Anda) kuat ke arah sendiri karena pengaruhnya ditingkatkan; pengaruhnya ditingkatkan karena sangat jauh dari rata-rata. Dalam konteks PCA memungkinkan variabel yang sangat miring sangat mirip dengan melakukan PCA tanpa memusatkan data (yaitu, melakukan PCA berdasarkan matriks kosinus daripada matriks korelasi). Ini adalah Anda yang memutuskan apakah akan mengizinkan ekor panjang untuk hasil pengaruh begitu sangat (dan membiarkan data menjadi) atau tidak (dan mengubah data). Masalahnya tidak terkait dengan bagaimana Anda melakukan interpretasi pemuatan.
Sesukamu.
KMO adalah indeks yang memberi tahu Anda apakah korelasi parsial cukup kecil untuk mengirimkan data ke analisis faktor. Karena dalam analisis faktor, kita biasanya mengharapkan suatu faktor memuat lebih dari dua variabel saja. KMO Anda cukup rendah. Anda dapat membuatnya lebih baik jika Anda drop dari variabel analisis dengan nilai-nilai KMO individu rendah (ini membentuk diagonal dari matriks anti-gambar , Anda dapat meminta untuk menunjukkan matriks ini dalam prosedur Faktor SPSS). Bisakah mentransformasikan variabel menjadi KMO memulihkan kurang miring? Siapa tahu. Mungkin. Perhatikan bahwa KMO penting terutama dalam model analisis Faktor, bukan model analisis Komponen Utama: di FA Anda cocok dengan korelasi berpasangan, sedangkan di PCA Anda tidak.
sumber
+1 ke @ttnphns, saya hanya ingin sedikit memperluas poin # 2. Transformasi sering digunakan untuk menstabilkan kemiringan. Seperti yang ditunjukkan oleh @ttnphns, Anda akan menggunakannya sebelum menjalankan analisis. Transformasi log adalah bagian dari keluarga transformasi daya Box-Cox. Anda akan ingin mempertimbangkan berbagai kemungkinan transformasi yang lebih luas daripada hanya log (mis., Akar kuadrat, timbal balik, dll.). Pilihan antara basis logaritmik yang berbeda tidak berpengaruh pada kekuatan transformasi. Ketika orang akan bekerja secara matematis dengan variabel yang diubah, log natural terkadang lebih disukai, karena log natural dapat menghasilkan matematika yang lebih bersih dalam beberapa kasus. Jika Anda tidak peduli tentang itu, Anda mungkin ingin memilih pangkalan yang akan memfasilitasi interpretasi. Artinya, setiap peningkatan unit dalam skala baru akan mewakili basis-lipat kali lipat dalam skala asli (misalnya, jika Anda menggunakan basis log 2, maka setiap unit akan menjadi peningkatan 2 kali lipat, basis 10 berarti setiap unit akan menjadi peningkatan 10 kali lipat, dll.), sehingga bisa menyenangkan untuk memilih basis yang sedemikian rupa sehingga data Anda akan menjangkau beberapa unit dalam skala yang diubah.
sumber