Di R, jika saya memanggil lm()
fungsi dengan cara berikut:
lm.1 = lm(response ~ var1 + var2 + var1 * var2)
summary(lm.1)
Ini memberi saya model linear dari variabel respons dengan var1
, var2
dan interaksi di antara mereka. Namun, bagaimana tepatnya kita menafsirkan istilah interaksi secara numerik?
Dokumentasi mengatakan ini adalah "persilangan" antara var1
dan var2
, tetapi tidak memberikan penjelasan tentang apa sebenarnya "salib" itu.
Akan sangat membantu bagi saya untuk mengetahui angka pasti R yang sedang dihitung untuk menggabungkan interaksi antara dua variabel.
r
regression
Enzo
sumber
sumber
var3 <- var 1 * var2
lalu membangunlm.2 <- lm(response ~ var1 + var2 + var3)
var1
danvar2
keduanya terus menerus (cukup sulit untuk menafsirkan, menurut pendapat saya) atau apakah salah satu dari ini adalah misalnya biner kategoris (. Mudah untuk mempertimbangkan) Lihat jawaban ini untuk beberapa contoh interpretasi oleh Peter Flom: stats.stackexchange.com/a/45512/16974Jawaban:
Cara standar untuk menulis persamaan prediksi untuk model Anda adalah:
Tetapi memahami interaksi itu sedikit lebih mudah jika kita memfaktorkannya secara berbeda:
Dengan anjak ini kita dapat melihat bahwa untuk nilai diberikan, intersep y untuk x 1 adalah b 0 + b 2 ∗ x 2 dan kemiringan pada x 1 adalah ( b 1 + b 12 ∗ x 2 ) . Jadi hubungan antara y dan x 1 tergantung pada x 2 .x2 x1 b0+ b2∗ x2 x1 ( b1+ b12∗ x2) y x1 x2
Predict.Plot
TkPredict
sumber
lm
Itukah yang kamu inginkan?
sumber
Paling mudah untuk memikirkan interaksi dalam hal variabel diskrit. Mungkin Anda mungkin telah mempelajari ANOVA dua arah, di mana kami memiliki dua variabel pengelompokan (misalnya jenis kelamin dan kategori usia, dengan tiga tingkat untuk usia) dan sedang melihat bagaimana mereka berhubungan dengan beberapa pengukuran berkelanjutan (variabel dependen kami, misalnya IQ).
Istilah x1 * x2, jika signifikan, dapat dipahami (dalam contoh sepele ini, yang dibuat-buat) sebagai IQ berperilaku berbeda di semua tingkatan usia untuk jenis kelamin yang berbeda. Sebagai contoh, mungkin IQ stabil untuk laki-laki di tiga kelompok umur, tetapi perempuan muda mulai di bawah laki-laki muda dan memiliki lintasan ke atas (dengan kelompok usia tua memiliki rata-rata lebih tinggi daripada kelompok usia tua untuk laki-laki). Dalam plot cara, ini akan menyiratkan garis horizontal untuk laki-laki di tengah grafik, dan mungkin garis 45 derajat untuk perempuan yang dimulai di bawah laki-laki tetapi berakhir di atas laki-laki.
Intinya adalah bahwa ketika Anda bergerak di sepanjang level satu variabel (atau "memegang X1 konstan"), apa yang terjadi dalam perubahan variabel lainnya. Interpretasi ini juga bekerja dengan variabel prediktor kontinu, tetapi tidak begitu mudah untuk diilustrasikan secara konkret. Dalam hal ini, Anda mungkin ingin mengambil nilai tertentu X1 dan X2 dan melihat apa yang terjadi pada Y.
sumber