Apa asumsi analisis faktor?

11

Saya ingin memeriksa apakah saya benar-benar memahami analisis faktor ( klasik, linier ), terutama asumsi yang dibuat sebelum (dan mungkin setelah) FA.

Beberapa data awalnya harus dikorelasikan dan ada kemungkinan hubungan linier di antara mereka. Setelah melakukan analisis faktor, data terdistribusi secara normal (distribusi bivariat untuk setiap pasangan) dan tidak ada korelasi antara faktor (umum dan spesifik), dan tidak ada korelasi antara variabel dari satu faktor dan variabel dari faktor lain.

Apakah itu benar?

Sihem
sumber

Jawaban:

12

Input data asumsi linear FA (Saya tidak berbicara di sini tentang asumsi internal / sifat model FA atau tentang memeriksa kualitas hasil pemasangan ).

  1. Skala (interval atau rasio) variabel input . Itu berarti item tersebut merupakan tindakan kontinu atau dikonseptualisasikan sebagai kontinu saat diukur pada skala kuantitatif diskrit. Tidak ada data ordinal dalam FA linier ( baca ). Data biner juga harus dihindari (lihat ini , ini ). Linear FA mengasumsikan bahwa faktor laten yang umum dan unik adalah kontinu . Oleh karena itu variabel yang diamati yang memuatnya harus kontinu juga.
  2. Korelasi linear . FA linear dapat dilakukan berdasarkan pada matriks asosiasi tipe SSCP : Korelasi Pearson, kovarian, kosinus, dll (meskipun beberapa metode / implementasi mungkin hanya terbatas pada korelasi Pearson). Perhatikan bahwa ini semua adalah produk aljabar linier. Meskipun demikian besarnya koefisien kovarians mencerminkan lebih dari sekadar linearitas dalam hubungannya, pemodelan dalam linear FA bersifat linear bahkan ketika kovariansi digunakan: variabel adalah kombinasi linear dari berbagai faktor.dan dengan demikian linearitas tersirat dalam asosiasi yang dihasilkan. Jika Anda melihat / berpikir asosiasi nonlinier berlaku - jangan lakukan linear FA atau mencoba untuk linierisasi mereka terlebih dahulu oleh beberapa transformasi data. Dan jangan mendasarkan FA linier pada korelasi Spearman atau Kendall (Pt. 4 di sana ).
  3. Tidak ada pencilan - seperti halnya metode non-semangat. Korelasi Pearson dan asosiasi tipe SSCP serupa sensitif terhadap outlier, jadi waspadalah.
  4. Ada korelasi yang cukup tinggi . FA adalah analisis korelasi, - apa gunanya ketika semua atau hampir semua korelasi lemah? - tidak ada gunanya. Namun, apa yang "berkorelasi cukup tinggi" tergantung pada bidang studi. Ada juga pertanyaan yang menarik dan beragam apakah korelasi yang sangat tinggi harus diterima (efeknya pada PCA, misalnya, dibahas di sini ). Untuk menguji secara statistik jika data tidak berkorelasi , uji kesegaran Bartlett dapat digunakan.
  5. Korelasi parsial lemah, dan faktor dapat cukup didefinisikan . FA mengasumsikan bahwa faktor-faktor lebih umum daripada hanya memuat pasangan item berkorelasi. Bahkan, ada saran untuk tidak mengekstraksi faktor yang memuat kurang dari 3 item dalam FA eksplotatori; dan dalam FA konfirmatori hanya 3+ struktur yang teridentifikasi-dijamin . Masalah teknis ekstraksi yang disebut kasus Heywood, sebagai salah satu alasan di balik, situasi terlalu banyak item-on-faktor. Kaiser-Meyer-Olkin ( KMO ) "mengukur kecukupan pengambilan sampel" memperkirakan untuk Anda seberapa lemah korelasi parsial dalam data relatif terhadap korelasi penuh; dapat dihitung untuk setiap item dan untuk seluruh matriks korelasi.
  6. p1n observations > p variablesn>>p
  7. Distribusi . Secara umum, FA linier tidak memerlukan normalitas data input. Distribusi dengan kemiringan sedang dapat diterima. Bimodality bukan kontra indikasi. Normalitas memang diasumsikan untuk faktor unik dalam model (mereka berfungsi sebagai kesalahan penyesalan) - tetapi tidak untuk faktor umum dan data input ( lihat juga). Namun, normalitas multivariat data dapat diperlukan sebagai asumsi tambahan dengan beberapa metode ekstraksi (yaitu, kemungkinan maksimum) dan dengan melakukan beberapa pengujian asimptotik.

1

ttnphns
sumber
, bisakah Anda membaca posting ini , sepertinya sedikit berbeda.
WhiteGirl
Jika Binary data should also be avoided, apa lagi metode analisis faktor yang dapat kita lakukan binary data?
kittygirl
ttnphns sayang; Saya perhatikan bahwa Anda tidak menyebutkan bahwa data dianggap normal dan online lainnya menunjukkan bahwa normalitas tidak diperlukan. Permintaan saya adalah jika variabel laten diasumsikan normal, dan pengamatan dimodelkan sebagai jumlah tertimbang dari faktor-faktor apakah ini maka tidak menyiratkan distribusi normal pada pengamatan? (Maaf, saya yakin ini pertanyaan bodoh)
user2957945
@ user2957945, Paragraf 7 mengatakan tentang normalitas. Asumsi normal diperlukan untuk beberapa metode ekstraksi faktor dan untuk melakukan dalam beberapa uji statistik fakultatif yang menyertai analisis faktor. Untuk pertanyaan Anda: Ya, jika faktor didistribusikan secara normal dan kesalahan juga normal, itu berarti variabel manifes juga normal.
ttnphns
ah, terima kasih @ttnphns; maaf mengganggu Anda - saya tidak tahu bagaimana saya bisa melewatkan itu. Hargai bantuan Anda.
user2957945
9

Sering kali, analisis faktor dilakukan tanpa uji statistik per se. Ini jauh lebih subyektif dan interpretif daripada metode seperti regresi, pemodelan persamaan struktural, dan sebagainya. Dan umumnya ini adalah tes inferensial yang datang dengan asumsi: agar nilai p dan interval kepercayaan menjadi benar, asumsi tersebut harus dipenuhi.

Sekarang, jika metode untuk memilih jumlah faktor ditetapkan menjadi metode kemungkinan maksimum, maka ada asumsi yang sesuai dengan ini: bahwa input variabel ke dalam analisis faktor akan memiliki distribusi normal.

Bahwa variabel input akan memiliki korelasi bukan nol adalah semacam asumsi di mana tanpa itu benar, hasil analisis faktor akan (mungkin) tidak berguna: tidak ada faktor yang akan muncul sebagai variabel laten di belakang beberapa set variabel input.

Sejauh ada "tidak ada korelasi antara faktor (umum dan spesifik), dan tidak ada korelasi antara variabel dari satu faktor dan variabel dari faktor lain," ini bukan asumsi universal yang dibuat oleh analis faktor, meskipun kadang-kadang kondisi baik (atau perkiraan itu) mungkin diinginkan. Yang terakhir, ketika dipegang, itu dikenal sebagai "struktur sederhana."

Ada kondisi lain yang kadang-kadang diperlakukan sebagai "asumsi": bahwa korelasi orde-nol (vanila) antara variabel-variabel input tidak terbanjiri oleh korelasi parsial yang besar. Singkatnya, ini berarti bahwa hubungan harus kuat untuk beberapa pasangan dan lemah untuk yang lain; jika tidak, hasilnya akan "berlumpur." Ini terkait dengan keinginan struktur sederhana dan sebenarnya dapat dievaluasi (meskipun tidak secara resmi "diuji") menggunakan statistik Kaiser-Meyer-Olkin, atau KMO. Nilai KMO dekat 0,8 atau 0,9 biasanya dianggap sangat menjanjikan untuk hasil analisis faktor informatif, sedangkan KMO di dekat 0,5 atau 0,6 jauh kurang menjanjikan, dan yang di bawah 0,5 mungkin mendorong analis untuk memikirkan kembali strateginya.

rolando2
sumber
Ketika saya membaca, analisis faktor itu dimulai dengan beberapa korelasi dengan variabel dan kami mencoba untuk membuat korelasi ini semakin jelas
Sihem
1
Setelah penerapan analisis Faktor, jika kita telah menggunakan rotasi ortogonal, kita akan yakin bahwa tidak ada korelasi antara faktor
Sihem
2

Asumsi yang mendasari analisis faktor eksplorasi adalah:
• Interval atau tingkat pengukuran rasio
• Pengambilan sampel acak
• Hubungan antara variabel yang diamati adalah linier
• Distribusi normal (setiap variabel yang diamati)
• Distribusi normal bivariat (setiap pasangan variabel yang diamati)
• Normalitas multivariat
Di atas dari yang berkas SAS

Chris Kelly
sumber