bagaimana menafsirkan istilah interaksi dalam rumus lm dalam R?

9

Di R, jika saya memanggil lm()fungsi dengan cara berikut:

lm.1 = lm(response ~ var1 + var2 + var1 * var2)
summary(lm.1)

Ini memberi saya model linear dari variabel respons dengan var1, var2dan interaksi di antara mereka. Namun, bagaimana tepatnya kita menafsirkan istilah interaksi secara numerik?

Dokumentasi mengatakan ini adalah "persilangan" antara var1dan var2, tetapi tidak memberikan penjelasan tentang apa sebenarnya "salib" itu.

Akan sangat membantu bagi saya untuk mengetahui angka pasti R yang sedang dihitung untuk menggabungkan interaksi antara dua variabel.

Enzo
sumber
Apakah Anda ingin secara khusus tahu bagaimana R membuat matriks desain untuk formula ini, atau apakah Anda lebih tertarik pada bagaimana menafsirkan istilah multiplicative ("interaksi") dalam hal model pas?
Momo
Saya lebih tertarik pada bagaimana menafsirkan istilah multiplikasi ini. Misalnya, jika saya ingin menulis rumus linear (rumus matematika, bukan rumus R ...), apa yang harus saya masukkan untuk istilah multiplikatif?
Enzo
Untuk menjelaskan apa arti silang, lihat menghitung var3 <- var 1 * var2lalu membangunlm.2 <- lm(response ~ var1 + var2 + var3)
James Stanley
1
jadi itu hanya perkalian entri-bijaksana?
Enzo
1
@Enzo, ya, salib secara harfiah dua istilah dikalikan - interpretasi akan sangat tergantung pada apakah var1dan var2keduanya terus menerus (cukup sulit untuk menafsirkan, menurut pendapat saya) atau apakah salah satu dari ini adalah misalnya biner kategoris (. Mudah untuk mempertimbangkan) Lihat jawaban ini untuk beberapa contoh interpretasi oleh Peter Flom: stats.stackexchange.com/a/45512/16974
James Stanley

Jawaban:

8

Cara standar untuk menulis persamaan prediksi untuk model Anda adalah:

y^=b0+b1x1+b2x2+b12x1x2

Tetapi memahami interaksi itu sedikit lebih mudah jika kita memfaktorkannya secara berbeda:

y^=(b0+b2x2)+(b1+b12x2)x1

Dengan anjak ini kita dapat melihat bahwa untuk nilai diberikan, intersep y untuk x 1 adalah b 0 + b 2x 2 dan kemiringan pada x 1 adalah ( b 1 + b 12x 2 ) . Jadi hubungan antara y dan x 1 tergantung pada x 2 .x2x1b0+b2x2x1(b1+b12x2)yx1x2

yx1x2Predict.PlotTkPredict

Greg Snow
sumber
3

x1x2lm

y=4x1+2x2+1.5x1x2

Itukah yang kamu inginkan?

Peter Flom
sumber
3

Paling mudah untuk memikirkan interaksi dalam hal variabel diskrit. Mungkin Anda mungkin telah mempelajari ANOVA dua arah, di mana kami memiliki dua variabel pengelompokan (misalnya jenis kelamin dan kategori usia, dengan tiga tingkat untuk usia) dan sedang melihat bagaimana mereka berhubungan dengan beberapa pengukuran berkelanjutan (variabel dependen kami, misalnya IQ).

Istilah x1 * x2, jika signifikan, dapat dipahami (dalam contoh sepele ini, yang dibuat-buat) sebagai IQ berperilaku berbeda di semua tingkatan usia untuk jenis kelamin yang berbeda. Sebagai contoh, mungkin IQ stabil untuk laki-laki di tiga kelompok umur, tetapi perempuan muda mulai di bawah laki-laki muda dan memiliki lintasan ke atas (dengan kelompok usia tua memiliki rata-rata lebih tinggi daripada kelompok usia tua untuk laki-laki). Dalam plot cara, ini akan menyiratkan garis horizontal untuk laki-laki di tengah grafik, dan mungkin garis 45 derajat untuk perempuan yang dimulai di bawah laki-laki tetapi berakhir di atas laki-laki.

Intinya adalah bahwa ketika Anda bergerak di sepanjang level satu variabel (atau "memegang X1 konstan"), apa yang terjadi dalam perubahan variabel lainnya. Interpretasi ini juga bekerja dengan variabel prediktor kontinu, tetapi tidak begitu mudah untuk diilustrasikan secara konkret. Dalam hal ini, Anda mungkin ingin mengambil nilai tertentu X1 dan X2 dan melihat apa yang terjadi pada Y.

Twitch_City
sumber