Membayangkan
- Anda menjalankan regresi linier dengan empat prediktor numerik (IV1, ..., IV4)
- Ketika hanya IV1 yang dimasukkan sebagai prediktor, beta terstandardisasi adalah
+.20
- Ketika Anda juga memasukkan IV2 ke IV4 tanda koefisien regresi standar dari IV1 membalik
-.25
(yaitu, itu menjadi negatif).
Ini menimbulkan beberapa pertanyaan:
- Berkenaan dengan terminologi, apakah Anda menyebutnya "efek penekan"?
- Strategi apa yang akan Anda gunakan untuk menjelaskan dan memahami efek ini?
- Apakah Anda memiliki contoh efek seperti itu dalam praktik dan bagaimana Anda menjelaskan dan memahami efek ini?
regression
predictor
Jeromy Anglim
sumber
sumber
Jawaban:
Multicollinearity adalah tersangka biasa seperti yang disebutkan JoFrhwld. Pada dasarnya, jika variabel Anda berkorelasi positif, maka koefisien akan berkorelasi negatif, yang dapat menyebabkan tanda yang salah pada salah satu koefisien.
Satu pemeriksaan akan melakukan regresi komponen utama atau regresi ridge. Ini mengurangi dimensi ruang regresi, menangani multikolinieritas. Anda berakhir dengan estimasi yang bias tetapi kemungkinan MSE lebih rendah dan tanda-tanda yang diperbaiki. Baik Anda menggunakan hasil tertentu atau tidak, itu adalah pemeriksaan diagnostik yang baik. Jika Anda masih mendapatkan perubahan tanda, mungkin secara teoritis menarik.
MEMPERBARUI
Mengikuti dari komentar dalam jawaban John Christie, ini mungkin menarik. Pembalikan dalam asosiasi (besarnya atau arah) adalah contoh-contoh Paradox Simpson, Paradoks Tuhan, dan Efek Penindasan. Perbedaan pada dasarnya berhubungan dengan jenis variabel. Lebih bermanfaat untuk memahami fenomena yang mendasarinya daripada berpikir dalam kerangka "paradoks" atau efek tertentu. Untuk perspektif kausal, makalah di bawah ini melakukan pekerjaan yang baik untuk menjelaskan mengapa dan saya akan mengutip panjang lebar perkenalan dan kesimpulan mereka untuk membangkitkan selera Anda.
sumber
Saya percaya efek seperti ini sering disebabkan oleh collinearity (lihat pertanyaan ini ). Saya pikir buku tentang pemodelan bertingkat oleh Gelman dan Hill membicarakannya. Masalahnya adalah yang
IV1
berkorelasi dengan satu atau lebih dari prediktor lain, dan ketika mereka semua termasuk dalam model, estimasi mereka menjadi tidak menentu.Jika koefisien membalik disebabkan oleh collinearity, maka itu tidak benar-benar menarik untuk dilaporkan, karena itu bukan karena hubungan antara prediktor Anda dengan hasil, tetapi benar-benar karena hubungan antara prediktor.
Apa yang saya lihat disarankan untuk menyelesaikan masalah ini adalah residualisasi. Pertama, Anda pas dengan sebuah model
IV2 ~ IV1
, lalu ambil residual dari model itu sebagairIV2
. Jika semua variabel Anda berkorelasi, Anda harus benar-benar residualkan semuanya. Anda dapat memilih untuk melakukannya seperti iniSekarang, pas dengan model terakhir
Sekarang, koefisien untuk
rIV2
mewakili efek independen dariIV2
diberikan korelasinya denganIV1
. Saya telah mendengar Anda tidak akan mendapatkan hasil yang sama jika Anda melakukan residualisasi dalam urutan yang berbeda, dan bahwa memilih urutan residualisasi benar-benar panggilan penilaian dalam penelitian Anda.sumber
O
, dan prediktor Anda adalahIncome
danFather's Income
. Fakta yangIncome
berkorelasi denganFather's Income
secara intrinsik menarik, tetapi fakta itu akan menjadi kenyataan tidak peduli nilainyaO
. Artinya, Anda dapat menetapkan bahwaO
prediktor semuanya linier tanpa pernah mengumpulkan data hasil Anda, atau bahkan mengetahui apa hasilnya! Fakta-fakta itu seharusnya tidak menjadi lebih menarik begitu Anda tahu ituO
benar-benarEducation
.Lihat Paradox Simpson . Singkatnya, efek utama yang diamati dapat terbalik ketika interaksi ditambahkan ke model. Pada halaman yang ditautkan sebagian besar contoh bersifat kategoris tetapi ada gambar di bagian atas halaman yang dapat dibayangkan secara terus menerus. Misalnya, jika Anda memiliki prediktor kategoris dan kontinu maka prediktor kontinu dapat dengan mudah membalik tanda jika yang kategoris ditambahkan dan dalam setiap kategori tanda berbeda dari skor keseluruhan.
sumber