Misalkan saya tertarik pada model regresi linier, untuk , karena saya ingin melihat apakah interaksi antara kedua kovariat berpengaruh pada Y.
Dalam catatan kursus seorang profesor (yang saya tidak punya kontak dengan), itu menyatakan: Ketika termasuk istilah interaksi, Anda harus memasukkan istilah derajat kedua mereka. yaitu harus dimasukkan dalam regresi.
Mengapa kita harus memasukkan istilah tingkat kedua ketika kita hanya tertarik pada interaksi?
Jawaban:
Itu tergantung pada tujuan inferensi. Jika Anda ingin membuat kesimpulan apakah ada interaksi, misalnya, dalam konteks sebab akibat (atau, lebih umum, jika Anda ingin menginterpretasikan koefisien interaksi), rekomendasi dari profesor Anda ini memang masuk akal, dan itu berasal dari fakta bahwa kesalahan spesifikasi bentuk fungsional dapat menyebabkan kesimpulan yang salah tentang interaksi .
Berikut adalah contoh sederhana di mana tidak ada istilah interaksi antara dan dalam persamaan struktural , namun, jika Anda tidak menyertakan istilah kuadrat , Anda akan salah menyimpulkan bahwa berinteraksi dengan padahal sebenarnya tidak t.x1 x2 y x1 x1 x2
Ini dapat ditafsirkan sebagai kasus bias variabel yang dihilangkan, dan di sini adalah variabel yang dihilangkan. Jika Anda kembali dan memasukkan istilah kuadrat dalam regresi Anda, interaksi yang tampak menghilang.x21
Tentu saja, alasan ini tidak hanya berlaku untuk istilah kuadrat, tetapi salah spesifikasi bentuk fungsional secara umum. Tujuannya di sini adalah untuk memodelkan fungsi harapan bersyarat secara tepat untuk menilai interaksi. Jika Anda membatasi diri untuk pemodelan dengan regresi linier, maka Anda harus memasukkan istilah-istilah nonlinier ini secara manual. Tetapi alternatifnya adalah dengan menggunakan pemodelan regresi yang lebih fleksibel, seperti misalnya regresi ridge kernel .
sumber
rm(list=ls())
kode yang diposting di sini! Jika orang hanya menyalin & menempel dan menjalankan kode, mereka bisa mendapatkan kejutan ... Saya menghapusnya untuk saat ini.Model pertama dapat diekspresikan kembali seperti ini:
Model kedua dapat diekspresikan kembali seperti ini:
Perhatikan bahwa saya menyederhanakan notasi yang Anda gunakan untuk konsistensi dan juga membuat istilah kesalahannya eksplisit di kedua model.
sumber