Saya menulis pertanyaan ini dengan merujuk pada contoh pada hal 138-142 dari dokumen berikut: ftp://ftp.software.ibm.com/software/analytics/spss/documentation/amos/20.0/id/Manuals/IBM_SPSS_Amos_User_Guide.pdf .
Berikut adalah gambar ilustrasi dan tabel:
Saya mengerti bahwa variabel laten tidak memiliki metrik alami dan pengaturan pemuatan faktor ke 1 dilakukan untuk memperbaiki masalah ini. Namun, ada beberapa hal yang saya tidak (sepenuhnya) mengerti:
Bagaimana cara memperbaiki pemuatan faktor ke 1 untuk memperbaiki ketidakpastian masalah skala ini?
Mengapa diperbaiki ke 1, bukan ke nomor lain?
Saya mengerti bahwa dengan menetapkan salah satu dari bobot indikator-> indikator untuk 1 maka kita membuat semua bobot regresi lainnya untuk faktor tersebut relatif terhadapnya. Tetapi apa yang terjadi jika kita menetapkan loading faktor tertentu menjadi 1 tetapi kemudian ternyata skor yang lebih tinggi pada faktor tersebut memprediksi skor yang lebih rendah pada variabel yang diamati? Setelah pada awalnya kita mengatur pemuatan faktor menjadi 1, bisakah kita mencapai bobot regresi yang dipahami negatif, atau menjadi bobot regresi standar yang negatif?
Dalam konteks ini saya telah melihat pemuatan faktor yang disebut sebagai koefisien regresi dan sebagai kovarian. Apakah kedua definisi ini sepenuhnya benar?
Mengapa kita perlu memperbaiki spasial-> visperc dan verbal-paragrap keduanya menjadi 1? Apa yang akan terjadi jika kita hanya memperbaiki salah satu dari jalur itu ke 1?
Melihat koefisien terstandarisasi, bagaimana bisa koefisien yang tidak standar untuk wordmean> kalimat> paragrap, tetapi melihat koefisien standar paragrap> wordmean> kalimat. Saya berpikir bahwa dengan memperbaiki paragrap ke 1 awalnya semua variabel lain yang dimuat pada faktor dibuat relatif terhadap paragrap.
Saya juga akan menambahkan pertanyaan yang saya bayangkan memiliki jawaban terkait: mengapa kita memperbaiki koefisien regresi untuk istilah unik (misalnya err_v-> visperc) menjadi 1? Apa artinya bagi err_v untuk memiliki koefisien 1 dalam memprediksi visperc?
Saya akan sangat menyambut tanggapan bahkan jika mereka tidak menjawab semua pertanyaan.
sumber
Jawaban:
Akhirnya, perhatikan bahwa err_v analog dengan istilah kesalahan dalam model regresi, misalnya, Kami memperbaiki koefisien pada err_v (yaitu, pada istilah kesalahan) ke 1 sehingga kami dapat memperkirakan varians kesalahan (yaitu, varians err_v).
sumber
Saya mungkin salah paham frasa "ketidakpastian skala", tapi saya percaya ini diatur untuk identifikasi. (Yaitu, jumlah tidak diketahui dalam sistem persamaan ini tidak boleh melebihi jumlah persamaan.) Tanpa menetapkan salah satu tautan ke satu, ada terlalu banyak yang tidak diketahui. Apakah itu sama dengan ketidakpastian skala?
Dalam sebagian besar aplikasi SEM, Anda bekerja dengan matriks kovarian, bukan data mentah. Ada algoritme alternatif yang menggunakan data asli, yang disebut PLS (Partial Least Squares), yang mungkin memberi sedikit cahaya tambahan pada hal-hal untuk Anda.
sumber
Pikirkan interpretasi seolah-olah itu hanya regresi sederhana. Koefisien mencerminkan perbedaan unit dalam variabel dependen yang terkait dengan perbedaan 1 unit dalam variabel independen. Jadi, jika perubahan 1 unit dalam IV dikaitkan dengan perubahan 1 unit pada DV, maka unit tersebut secara fungsional setara. Anda memerlukan unit untuk variabel laten karena Anda ingin memperkirakan variansnya, yang bukan unitless. Masalah identifikasi terkait, dalam hal untuk CFA sederhana dengan 1 variabel laten dan 3 indikator, model tidak diidentifikasi kecuali kendala dibuat.
Anda dapat mengaturnya ke nomor berapa pun, dan sifat keseluruhan hasilnya akan sama (mudah diperiksa dengan melihat model yang cocok, yang akan identik). Lebih mudah menafsirkan model jika Anda menetapkannya ke 1.
Terlepas dari bagaimana Anda memperbaiki salah satu pemuatan faktor, Anda bisa mendapatkan item yang dimuat secara positif dan negatif untuk variabel laten yang sama. Anda dapat menguji ini dengan mengalikan salah satu indikator Anda dengan -1 dan memperkirakan model Anda lagi.
Mereka secara fungsional adalah hal yang sama jika koefisien regresi tidak disesuaikan (yaitu variabel dependen hanya memiliki 1 panah yang menunjuk ke sana). Jika ini masalahnya, satu dapat dihitung dari yang lain.
Cobalah! Setiap variabel laten membutuhkan skala, untuk alasan yang telah dinyatakan.
Ini adalah masalah skala dan alasan tepatnya untuk menggunakan koefisien terstandarisasi. Saya dapat membuat koefisien regresi menjadi besar secara sembarang dengan membagi DV dengan angka yang lebih besar dan lebih besar. Dengan demikian perubahan 1 unit dalam IV akan menghasilkan perubahan yang lebih besar dan lebih besar dalam unit DV. Dengan normalisasi, dan membandingkan suka untuk suka, kami menghindari masalah ini.
Memperbaiki faktor kesalahan memuat ke 1 hanya membuat interpretasi lebih mudah. Itu membuat persamaan regresi masing-masing dalam SEM mengambil bentuk akrab dari Y = BX + e (atau Y = BX + 1 * e).
sumber
Stata memiliki dokumentasi yang sangat bagus tentang SEM di sini , lihat bagian "Identifikasi 2", ia memiliki jawaban untuk semua pertanyaan Anda.
tidak adanya skala muncul karena variabel laten Anda tidak dapat diamati. Anda mungkin menemukan jawaban numerik dalam survei kebahagiaan, tetapi kebahagiaan itu sendiri tidak diukur secara langsung. sekarang Anda harus menghubungkan jawaban seperti 1 hingga 10 dengan kebahagiaan. jadi Anda menunjuk salah satu pertanyaan sebagai jangkar dan mengatur pemuatannya ke 1.
tidak harus 1, bisa berupa nilai apa pun, tetapi 1 nyaman.
baik spasial dan verbal tidak dapat diamati, jadi Anda perlu mengatur skala untuk keduanya, sehingga Anda memiliki jangkar untuk masing-masing.
sumber