Metode ekstraksi faktor terbaik dalam analisis faktor

29

SPSS menawarkan beberapa metode ekstraksi faktor:

  1. Komponen utama (yang sama sekali bukan analisis faktor)
  2. Kuadrat terkecil tertimbang
  3. Kuadrat terkecil umum
  4. Kemungkinan Maksimum
  5. Sumbu Utama
  6. Anjak piutang
  7. Anjak gambar

Mengabaikan metode pertama, yang bukan analisis faktor (tetapi analisis komponen utama, PCA), yang mana dari metode ini yang "terbaik"? Apa keuntungan relatif dari metode yang berbeda? Dan pada dasarnya, bagaimana saya memilih yang mana yang akan digunakan?

Pertanyaan tambahan: haruskah seseorang mendapatkan hasil yang serupa dari ke-6 metode?

Placidia
sumber
Hmm, impuls pertama saya: tidak ada entri wikipedia tentang ini Jika tidak - tentunya harus ada satu ...
Gottfried Helms
4
Ya, ada artikel wikipedia. Dikatakan menggunakan MLE jika datanya normal dan PAF sebaliknya. Itu tidak banyak bicara tentang manfaat atau pilihan lain. Bagaimanapun, saya akan senang mengetahui pendapat anggota situs ini tentang masalah ini, berdasarkan pengalaman praktis mereka.
Placidia

Jawaban:

41

Untuk membuatnya singkat. Dua metode terakhir masing-masing sangat istimewa dan berbeda dari angka 2-5. Mereka semua disebut analisis faktor umum dan memang dipandang sebagai alternatif. Sebagian besar waktu, mereka memberikan hasil yang agak mirip . Mereka "umum" karena mereka mewakili model faktor klasik , faktor umum + model faktor unik. Model inilah yang biasanya digunakan dalam analisis / validasi kuesioner.

Principal Axis (PAF) , alias Principal Factor dengan iterasi adalah metode tertua dan mungkin belum cukup populer. Ini adalah aplikasi PCA 1 berulang ke matriks di mana komunitas berdiri diagonal di tempat 1s atau varian. Setiap iterasi berikutnya dengan demikian menyempurnakan komunitas lebih jauh sampai mereka bertemu. Dengan demikian, metode yang berusaha menjelaskan varians, bukan korelasi berpasangan, akhirnya menjelaskan korelasi. Metode Principal Axis memiliki kelebihan karena dapat, seperti PCA, menganalisis tidak hanya korelasi, tetapi juga kovariansi dan lainnya.1Tindakan SSCP (raw sscp, cosinus). Tiga metode lainnya hanya memproses korelasi [dalam SPSS; kovarian dapat dianalisis dalam beberapa implementasi lain]. Metode ini tergantung pada kualitas perkiraan awal komunitas (dan itu adalah kelemahannya). Biasanya kuadrat korelasi ganda / kovarian digunakan sebagai nilai awal, tetapi Anda mungkin lebih suka perkiraan lain (termasuk yang diambil dari penelitian sebelumnya). Silakan baca ini untuk lebih lanjut. Jika Anda ingin melihat contoh perhitungan faktorasi sumbu utama, dikomentari dan dibandingkan dengan perhitungan PCA, silakan lihat di sini .

2

34

Kemungkinan Maksimum (ML)mengasumsikan data (korelasi) berasal dari populasi yang memiliki distribusi normal multivariat (metode lain tidak membuat asumsi seperti itu) dan karenanya residu koefisien korelasi harus terdistribusi normal sekitar 0. Pembebanan diperkirakan secara iteratif dengan pendekatan ML berdasarkan asumsi di atas. Perlakuan korelasi ditimbang oleh keunikan dengan cara yang sama seperti dalam metode kuadratisasi Generalized. Sementara metode lain hanya menganalisis sampel apa adanya, metode ML memungkinkan beberapa kesimpulan tentang populasi, sejumlah indeks kecocokan dan interval kepercayaan biasanya dihitung bersama dengan itu [sayangnya, sebagian besar tidak dalam SPSS, meskipun orang menulis makro untuk SPSS yang melakukan saya t].

Semua metode yang saya jelaskan singkat adalah model laten linier, kontinu. "Linear" menyiratkan bahwa korelasi peringkat, misalnya, tidak boleh dianalisis. "Berkelanjutan" menyiratkan bahwa data biner, misalnya, tidak boleh dianalisis (IRT atau FA berdasarkan korelasi tetrakorik akan lebih tepat).


1R

2kamu2

3kamuR-1kamukamu-1Rkamu-1

4

masukkan deskripsi gambar di sini

ttnphns
sumber
Saya pikir, kita harus menambahkan lebih banyak aspek: apakah kita menggunakan metode yang sesuai dengan solusi faktor ke sejumlah faktor yang ditentukan sebelumnya, atau apakah jumlah faktor harus muncul dari data, dengan beberapa kriteria (nilai eigen, screetest, ...) . Seperti yang saya pahami, ML hanya masuk akal jika Anda menentukan lebih dulu sejumlah faktor, dan kemudian solusi faktor akan dicari, dan bahkan uji chi-square pun dimungkinkan. PCA memungkinkan sejumlah faktor muncul secara dinamis oleh properti-data, diberikan beberapa kriteria, tanpa uji chi-square. PAF dapat digunakan dengan dua cara.
Gottfried Helms
1
@ Gottfried, saya lebih suka tidak setuju dengan cara Anda mengatakannya. Metode Semua FA membutuhkan sejumlah faktor m diketahui: Anda cocok model untuk m Anda tentukan. Anda dapat menggunakan berbagai kriteria yang dapat membantu memutuskan m , tetapi semua ini bukan bagian dari metode ekstraksi faktor itu sendiri. Dengan pengecualian chi-square itu, dihitung bersama dengan metode GLS dan ML. Juga, dengan metode PA, jika Anda tahu komunitas yang sebenarnya di muka (yang sangat jarang), Anda dapat membuat mereka untuk membimbing Anda menuju yang terbaik m . Tetapi bagaimanapun, Anda, bukan algoritma ekstraksi, yang memutuskan m .
ttnphns
Sekarang apa yang harus kita gunakan? Yang mana yang terbaik?
MrYouMath
1
Yang terbaik adalah yang paling Anda sukai. Anda memilih, maka jika perlu Anda menjelaskan mengapa itu cocok untuk Anda. Seperti di mana-mana.
ttnphns
@ ttnphns, apakah ada prinsip when to use which?
kittygirl