Mengapa mengatur bobot ke 1 dalam analisis faktor konfirmasi?

8

Saya menulis pertanyaan ini dengan merujuk pada contoh pada hal 138-142 dari dokumen berikut: ftp://ftp.software.ibm.com/software/analytics/spss/documentation/amos/20.0/id/Manuals/IBM_SPSS_Amos_User_Guide.pdf .

Berikut adalah gambar ilustrasi dan tabel: Contoh CFA

Saya mengerti bahwa variabel laten tidak memiliki metrik alami dan pengaturan pemuatan faktor ke 1 dilakukan untuk memperbaiki masalah ini. Namun, ada beberapa hal yang saya tidak (sepenuhnya) mengerti:

  1. Bagaimana cara memperbaiki pemuatan faktor ke 1 untuk memperbaiki ketidakpastian masalah skala ini?

  2. Mengapa diperbaiki ke 1, bukan ke nomor lain?

  3. Saya mengerti bahwa dengan menetapkan salah satu dari bobot indikator-> indikator untuk 1 maka kita membuat semua bobot regresi lainnya untuk faktor tersebut relatif terhadapnya. Tetapi apa yang terjadi jika kita menetapkan loading faktor tertentu menjadi 1 tetapi kemudian ternyata skor yang lebih tinggi pada faktor tersebut memprediksi skor yang lebih rendah pada variabel yang diamati? Setelah pada awalnya kita mengatur pemuatan faktor menjadi 1, bisakah kita mencapai bobot regresi yang dipahami negatif, atau menjadi bobot regresi standar yang negatif?

  4. Dalam konteks ini saya telah melihat pemuatan faktor yang disebut sebagai koefisien regresi dan sebagai kovarian. Apakah kedua definisi ini sepenuhnya benar?

  5. Mengapa kita perlu memperbaiki spasial-> visperc dan verbal-paragrap keduanya menjadi 1? Apa yang akan terjadi jika kita hanya memperbaiki salah satu dari jalur itu ke 1?

  6. Melihat koefisien terstandarisasi, bagaimana bisa koefisien yang tidak standar untuk wordmean> kalimat> paragrap, tetapi melihat koefisien standar paragrap> wordmean> kalimat. Saya berpikir bahwa dengan memperbaiki paragrap ke 1 awalnya semua variabel lain yang dimuat pada faktor dibuat relatif terhadap paragrap.

Saya juga akan menambahkan pertanyaan yang saya bayangkan memiliki jawaban terkait: mengapa kita memperbaiki koefisien regresi untuk istilah unik (misalnya err_v-> visperc) menjadi 1? Apa artinya bagi err_v untuk memiliki koefisien 1 dalam memprediksi visperc?

Saya akan sangat menyambut tanggapan bahkan jika mereka tidak menjawab semua pertanyaan.

user1205901 - Pasang kembali Monica
sumber
1
Berikut adalah dua artikel menarik tentang pengaturan skala variabel laten: Gonzalez & Griffin (2001): Menguji parameter dalam SEM: Setiap "satu" penting ( www-personal.umich.edu/~gonzo/papers/sem.pdf ), Little, Slegers, & Card (2006): Cara non-arbitrer untuk mengidentifikasi dan menskala variabel laten dalam model SEM dan MACS ( agencylab.ku.edu/ ~ agencylab / manuscripts/… )
Patrick Coulombe
Bagaimana jika Anda menetapkan lebih dari 1 bobot menjadi satu? Apakah hasilnya sama?
Behacad

Jawaban:

10
  1. Karena itu memungkinkan Anda untuk menggunakan hubungan antara variabel laten dan variabel yang diamati untuk menentukan varians dari variabel laten. Sebagai contoh, pertimbangkan regresi Y pada X. Jika saya diizinkan mengubah varians X, katakanlah, dengan mengalikannya dengan konstanta, maka saya dapat mengubah koefisien regresi secara sewenang-wenang. Jika sebaliknya saya memperbaiki nilai koefisien regresi, maka ini menentukan varian X.
  2. Dengan konvensi, dan untuk membuatnya lebih mudah untuk membandingkan koefisien satu sama lain.
  3. Dalam hal itu, variabel laten menjadi terbalik. Misalnya, misalkan variabel laten kami adalah kemampuan matematika, variabel yang kami amati adalah jumlah kesalahan pada suatu tes, dan kami memperbaiki koefisien regresi menjadi 1. Kemudian variabel laten kami akan menjadi "kesulitan dengan matematika" alih-alih kemampuan matematika, dan koefisien untuk variabel lain yang diamati akan berubah sesuai.
  4. Jika variabel yang diamati dan variabel laten keduanya distandarisasi (yaitu, standar deviasi sama dengan 1), maka koefisien regresi sama dengan kovarians.
  5. Ini memperbaiki spasial -> visperc ke 1 yang memungkinkan estimasi varians spasial (lihat jawaban atas (1) di atas). Demikian juga, memperbaiki verbal -> paragrap memungkinkan estimasi varian verbal. Model dengan hanya satu dari kendala ini tidak dapat diidentifikasi.
  6. Karena perbedaan antara koefisien yang tidak standar dan standar tidak hanya bergantung pada varian verbal, tetapi juga pada varian paragrap, kalimat, dan wordmean. Misalnya, koefisien standar untuk wordmean sama dengan koefisien tidak standar dikalikan dengan , atau .SDverbalSDwordmean2.234×9.682(2.2342×9.682)+19.925=0.841

Akhirnya, perhatikan bahwa err_v analog dengan istilah kesalahan dalam model regresi, misalnya, Kami memperbaiki koefisien pada err_v (yaitu, pada istilah kesalahan) ke 1 sehingga kami dapat memperkirakan varians kesalahan (yaitu, varians err_v).

visperc=β0+β1spatial+err_v
Phil Schumm
sumber
7
  1. Saya mungkin salah paham frasa "ketidakpastian skala", tapi saya percaya ini diatur untuk identifikasi. (Yaitu, jumlah tidak diketahui dalam sistem persamaan ini tidak boleh melebihi jumlah persamaan.) Tanpa menetapkan salah satu tautan ke satu, ada terlalu banyak yang tidak diketahui. Apakah itu sama dengan ketidakpastian skala?

  2. Dalam sebagian besar aplikasi SEM, Anda bekerja dengan matriks kovarian, bukan data mentah. Ada algoritme alternatif yang menggunakan data asli, yang disebut PLS (Partial Least Squares), yang mungkin memberi sedikit cahaya tambahan pada hal-hal untuk Anda.

Wayne
sumber
1. Sebagian besar artikel cenderung memperlakukan ketidakpastian skala dan pengidentifikasian seolah-olah mereka adalah masalah yang terpisah. Salah satu argumen yang mendukung perbedaan adalah bahwa jika kita menambahkan lebih banyak variabel yang diamati maka rasio yang diketahui dengan yang tidak diketahui naik tetapi itu tidak meniadakan perlunya pemuatan untuk diatur ke 1. 2. Terima kasih atas tip mengenai PLS .
user1205901
4
  1. Pikirkan interpretasi seolah-olah itu hanya regresi sederhana. Koefisien mencerminkan perbedaan unit dalam variabel dependen yang terkait dengan perbedaan 1 unit dalam variabel independen. Jadi, jika perubahan 1 unit dalam IV dikaitkan dengan perubahan 1 unit pada DV, maka unit tersebut secara fungsional setara. Anda memerlukan unit untuk variabel laten karena Anda ingin memperkirakan variansnya, yang bukan unitless. Masalah identifikasi terkait, dalam hal untuk CFA sederhana dengan 1 variabel laten dan 3 indikator, model tidak diidentifikasi kecuali kendala dibuat.

  2. Anda dapat mengaturnya ke nomor berapa pun, dan sifat keseluruhan hasilnya akan sama (mudah diperiksa dengan melihat model yang cocok, yang akan identik). Lebih mudah menafsirkan model jika Anda menetapkannya ke 1.

  3. Terlepas dari bagaimana Anda memperbaiki salah satu pemuatan faktor, Anda bisa mendapatkan item yang dimuat secara positif dan negatif untuk variabel laten yang sama. Anda dapat menguji ini dengan mengalikan salah satu indikator Anda dengan -1 dan memperkirakan model Anda lagi.

  4. Mereka secara fungsional adalah hal yang sama jika koefisien regresi tidak disesuaikan (yaitu variabel dependen hanya memiliki 1 panah yang menunjuk ke sana). Jika ini masalahnya, satu dapat dihitung dari yang lain.

  5. Cobalah! Setiap variabel laten membutuhkan skala, untuk alasan yang telah dinyatakan.

  6. Ini adalah masalah skala dan alasan tepatnya untuk menggunakan koefisien terstandarisasi. Saya dapat membuat koefisien regresi menjadi besar secara sembarang dengan membagi DV dengan angka yang lebih besar dan lebih besar. Dengan demikian perubahan 1 unit dalam IV akan menghasilkan perubahan yang lebih besar dan lebih besar dalam unit DV. Dengan normalisasi, dan membandingkan suka untuk suka, kami menghindari masalah ini.

  7. Memperbaiki faktor kesalahan memuat ke 1 hanya membuat interpretasi lebih mudah. Itu membuat persamaan regresi masing-masing dalam SEM mengambil bentuk akrab dari Y = BX + e (atau Y = BX + 1 * e).

DL Dahly
sumber
Saya bingung tentang apa yang Anda katakan di # 5 tentang memperbaiki kovarians menjadi 1. Tentunya yang Anda maksud adalah korelasi dan bukan kovarians (kecuali kedua variabel memiliki varian 1), benar? Juga, jika Anda bermaksud menetapkan korelasi ke 1, tampaknya kedua variabel akan secara efektif dikurangi menjadi satu variabel (dan tidak hanya diletakkan pada skala yang sama), mengingat mereka akan selalu mengambil nilai yang sama
Patrick Coulombe
2

Stata memiliki dokumentasi yang sangat bagus tentang SEM di sini , lihat bagian "Identifikasi 2", ia memiliki jawaban untuk semua pertanyaan Anda.

tidak adanya skala muncul karena variabel laten Anda tidak dapat diamati. Anda mungkin menemukan jawaban numerik dalam survei kebahagiaan, tetapi kebahagiaan itu sendiri tidak diukur secara langsung. sekarang Anda harus menghubungkan jawaban seperti 1 hingga 10 dengan kebahagiaan. jadi Anda menunjuk salah satu pertanyaan sebagai jangkar dan mengatur pemuatannya ke 1.

tidak harus 1, bisa berupa nilai apa pun, tetapi 1 nyaman.

baik spasial dan verbal tidak dapat diamati, jadi Anda perlu mengatur skala untuk keduanya, sehingga Anda memiliki jangkar untuk masing-masing.

Aksakal
sumber