Saat ini saya menjalankan model regresi berganda menggunakan data yang diperhitungkan dan memiliki beberapa pertanyaan.
Latar Belakang:
Menggunakan SPSS 18. Data saya tampaknya MAR. Penghapusan kasus secara berurutan membuat saya hanya memiliki 92 kasus, beberapa imputasi menyisakan 153 kasus untuk dianalisis. Semua asumsi terpenuhi - satu log variabel ditransformasikan. 9 IV 5 - 5 kategori, 3 skala, 1 interval. Skala DV. Menggunakan metode enter regresi berganda standar.
- DV saya adalah perbedaan skor antara skor pra-skor dan skor paska, kedua variabel ini tidak memiliki sejumlah kasus - haruskah saya menghitung nilai yang hilang untuk masing-masing dan kemudian menghitung perbedaan di antara mereka untuk menghitung DV saya (bagaimana cara saya melakukan ini), atau bisakah saya menghubungkan data untuk DV saya? Pendekatan mana yang paling tepat?
- Haruskah saya menjalankan imputasi pada data yang ditransformasi atau data miring yang tidak diubah?
- Haruskah saya memasukkan semua variabel ke dalam proses imputasi, bahkan jika mereka tidak kehilangan data, atau haruskah saya memasukkan data untuk variabel yang hilang lebih dari 10% kasus?
Saya telah menjalankan regresi pada kasus-kasus yang terhapus secara listwise dan akun IV saya untuk sangat sedikit varians dalam DV saya, kemudian saya telah menjalankan regresi pada file lengkap berikut beberapa imputasi - Hasilnya sangat mirip, bahwa 9 IV saya masih memprediksi hanya sekitar 12% dari varians dalam DV saya, namun, sekarang salah satu IV saya menunjukkan bahwa itu membuat kontribusi yang signifikan (ini kebetulan merupakan variabel yang diubah log) ...
- Haruskah saya melaporkan data asli jika ada sedikit perbedaan antara kesimpulan saya - yaitu IV saya buruk memprediksi dv, atau melaporkan data lengkap?
R^2
terjadi). Lihat beberapa diskusi menarik tentang desain pra-posting di sini . Meskipun itu masih benar-benar tidak menjawab pertanyaan Anda!Jawaban:
Referensi
Edwards, JR (1994). Analisis regresi sebagai alternatif untuk skor perbedaan. Jurnal Manajemen , 20 , 683-689.
Enders, CK (2010). Analisis Data Hilang yang Diterapkan . New York, NY: Guilford Press.
sumber
Dalam pengalaman saya, fungsi imputasi SPSS mudah digunakan, baik dalam membuat dataset maupun dalam menganalisis dan mengumpulkan set data imputasi yang dihasilkan. Namun, kemudahan penggunaannya adalah kejatuhannya juga. Jika Anda melihat fungsi imputasi yang sama dalam
R
perangkat lunak statistik (lihat misalnyamice
paket), Anda akan melihat lebih banyak opsi. Lihat situs web Stef van Buurens untuk penjelasan yang sangat baik tentang berbagai imputasi secara umum (dengan atau tanpa menggunakan paket mouse).Sangat penting untuk dicatat bahwa opsi tambahan ini bukan pilihan 'mewah' hanya untuk pengguna tingkat lanjut . Beberapa sangat penting untuk mencapai pengertian yang tepat , model spesifik untuk variabel hilang spesifik , prediktor spesifik untuk variabel hilang spesifik , diagnostik imputasi , dan banyak lagi, yang tidak tersedia dalam fungsi imputasi SPSS.
Untuk pertanyaan Anda:
sumber