Apakah transformasi data pada data non-normal diperlukan untuk analisis faktor eksplorasi ketika menggunakan metode ekstraksi anjak sumbu utama?

9

Saya mengembangkan kuesioner untuk mengukur empat faktor yang merupakan spiritualitas, dan saya ingin mengajukan pertanyaan berikut:

Apakah transformasi data pada data non-normal diperlukan untuk analisis faktor eksplorasi ketika menggunakan metode ekstraksi anjak sumbu utama?

Saya selesai menyaring data saya kemarin, dan saya menemukan bahwa 3 dari 20 pertanyaan condong positif sedangkan 1 dari 20 pertanyaan condong negatif (Pertanyaan 6 = 4.88, Pertanyaan 9 = 7.22, Pertanyaan 12 = 11.11, Pertanyaan 16 = -6.26). Saya juga menemukan bahwa 1 pertanyaan (dari 20) adalah leptokurtik (Pertanyaan 12 = 12.21).

Saya memilih metode ekstraksi anjak sumbu utama karena saya membaca bahwa itu digunakan pada "data sangat tidak normal" sementara kemungkinan maksimum digunakan pada data normal, tetapi:

  1. Bagaimana saya tahu jika data saya "sangat" tidak normal?

  2. Jika data saya "sangat tidak normal", apakah ini berarti saya dapat meninggalkan data seperti sekarang (tidak mengubahnya) dan menganalisisnya menggunakan metode ekstraksi anjak sumbu utama? Atau apakah saya perlu mengubah data sebelum melanjutkan dengan PUS?

  3. Jika saya perlu mengubah data, transformasi apa yang akan saya gunakan untuk item yang condong positif, condong negatif, dan leptokurtik?

Madeline
sumber

Jawaban:

10

Analisis faktor pada dasarnya adalah model regresi linier (terbatas). Dalam model ini, setiap variabel yang dianalisis adalah variabel dependen, faktor umum adalah IV, dan faktor unik tersirat berfungsi sebagai istilah kesalahan. (Istilah konstan ditetapkan ke nol karena pemusatan atau standardisasi yang tersirat dalam perhitungan kovarian atau korelasi.) Jadi, persis seperti dalam regresi linier, mungkin ada asumsi "kuat" tentang normalitas - IV (faktor umum) adalah multivariat normal dan kesalahan (faktor unik) adalah normal, yang secara otomatis mengarah ke DV normal; dan asumsi "lemah" tentang normalitas - kesalahan (faktor unik) hanya normal, oleh karena itu DV tidak perlu normal. Baik dalam regresi dan FA kita biasanya mengakui asumsi "lemah" karena lebih realistis.

Di antara metode ekstraksi FA klasik hanya metode kemungkinan maksimum, karena menyimpang dari karakteristik populasi, menyatakan bahwa variabel yang dianalisis adalah multivariat normal. Metode seperti sumbu utama atau residu minimal tidak memerlukan asumsi "kuat" ini (walaupun Anda tetap bisa membuatnya).

Harap diingat bahwa meskipun variabel Anda normal secara terpisah, itu tidak selalu menjamin bahwa data Anda normal multivarian.

Mari kita menerima asumsi "lemah" tentang normalitas. Apa potensi ancaman yang berasal dari data yang sangat miring, seperti Anda, lalu? Itu outlier. Jika distribusi variabel sangat asimetris, ekor yang lebih panjang menjadi lebih berpengaruh dalam menghitung korelasi atau kovariansi, dan secara bersamaan memprovokasi kekhawatiran tentang apakah masih mengukur konstruksi psikologis yang sama (faktor) seperti ekor yang lebih pendek. Mungkin hati-hati untuk membandingkan apakah matriks korelasi yang dibangun di bagian bawah dan bagian atas dari skala penilaian sama atau tidak. Jika mereka cukup mirip, Anda dapat menyimpulkan bahwa kedua ekor mengukur hal yang sama dan tidak mengubah variabel Anda. Kalau tidak, Anda harus mempertimbangkan mengubah atau tindakan lain untuk menetralisir efek ekor panjang "outlier".

Transformasi banyak. Misalnya, naik ke daya> 1 atau eksponensial digunakan untuk data yang condong ke kiri, dan daya <1 atau logaritma - untuk yang condong ke kanan. Pengalaman saya sendiri mengatakan bahwa apa yang disebut transformasi optimal melalui PCA Kategorikal yang dilakukan sebelum FA hampir selalu bermanfaat, karena biasanya mengarah pada faktor-faktor FA yang lebih jelas dan dapat ditafsirkan; dengan asumsi bahwa sejumlah faktor diketahui, ia mengubah data Anda secara nonlinier sehingga memaksimalkan keseluruhan varians yang diperhitungkan oleh sejumlah faktor tersebut.

ttnphns
sumber
Terima kasih atas jawaban anda! Dan apakah Anda akan merekomendasikan untuk menghapus pertanyaan 12 karena keduanya condong positif dan leptokurtik, atau lebih baik meninggalkannya dan mengubahnya?
Madeline
Saya akan menahan diri dari saran langsung, tidak di sepatu Anda. Berbicara secara umum, sangat condong secara kronis (= terlalu sulit atau terlalu mudah) atau leptokurtik (tidak peka terhadap perbedaan di antara responden biasa) pertanyaan adalah pertanyaan "buruk" secara psikometrik, dan layak untuk direvisi.
ttnphns
1

Saya baru saja memposting apa yang saya pelajari dari Yong dan Pearce (2013).

Untuk melakukan analisis faktor, harus ada normalitas univariat dan multivariat dalam data (Child, 2006)

Yong, AG, & Pearce, S. (2013). Panduan pemula untuk analisis faktor: Berfokus pada analisis faktor eksplorasi. Tutorial dalam metode kuantitatif untuk psikologi , 9 (2), 79-94. DOI: 10.20982 / tqmp.09.2.p079

Chris Kelly
sumber