Regresi moderat: Mengapa kita menghitung istilah * produk * di antara para prediktor?

12

Analisis regresi moderat sering digunakan dalam ilmu sosial untuk menilai interaksi antara dua atau lebih prediktor / kovariat.

Biasanya, dengan dua variabel prediktor, model berikut ini diterapkan:

Y=β0+β1X+β2M+β3XM+e

Perhatikan bahwa uji moderasi dioperasionalkan oleh istilah produk XM (perkalian antara variabel independen X dan variabel moderator M ). Pertanyaan saya yang sangat mendasar adalah: mengapa kita benar-benar menghitung istilah produk antara X dan M ? Mengapa tidak, misalnya, perbedaan absolut |MX|atau hanya jumlah X+M ?

Menariknya, Kenny menyinggung masalah ini di sini http://davidakenny.net/cm/moderation.htm dengan mengatakan: "Seperti yang akan dilihat, tes moderasi tidak selalu dioperasionalkan oleh istilah produk XM" tetapi tidak ada penjelasan lebih lanjut diberikan . Ilustrasi atau bukti formal akan mencerahkan, saya kira / harapan.

penyebut
sumber

Jawaban:

12

"Moderator" memengaruhi koefisien regresi Y terhadap X : mereka mungkin berubah ketika nilai-nilai perubahan moderator. Dengan demikian, secara umum penuh, model regresi moderasi sederhana adalah

E(Y)=α(M)+β(M)X

mana dan adalah fungsi dari moderator daripada konstanta tidak terpengaruh oleh nilai-nilai .αβMM

Dalam semangat yang sama di mana regresi didasarkan pada pendekatan linear dari hubungan antara dan , kita dapat berharap bahwa baik dan adalah - setidaknya sekitar - fungsi linear seluruh rentang nilai dalam data:XYαβMM

E(Y)=α0+α1M+O(M2)+(β0+β1M+O(M2))X=α0+β0X+α1M+β1MX+O(M2)+O(M2)X.

Menjatuhkan istilah nonlinier ("big-O"), dengan harapan mereka terlalu kecil, memberikan model interaksi multiplikatif (bilinear)

(1)E(Y)=α0+β0X+α1M+β1MX.

Derivasi ini menunjukkan interpretasi yang menarik dari koefisien: adalah tingkat di mana mengubah intersep sedangkan adalah tingkat di mana mengubah kemiringan . ( dan adalah kemiringan dan mencegat ketika (secara formal) disetel ke nol.) adalah koefisien dari "istilah produk" . Itu menjawab pertanyaan dengan cara ini:α1Mβ1Mα0β0Mβ1MX

Kita model moderasi dengan istilah produk ketika kita mengharapkan moderator akan (kira-kira, rata-rata) memiliki hubungan linear dengan kemiringan vs .MXMY X


Yang menarik adalah bahwa derivasi ini menunjukkan jalan menuju perluasan alami model, yang mungkin menyarankan cara untuk memeriksa goodness of fit. Jika Anda tidak peduli dengan nonlinier di tahu atau menganggap bahwa model akurat - maka Anda ingin memperpanjang model untuk mengakomodasi persyaratan yang dijatuhkan:X(1)

E(Y)=α0+β0X+α1M+β1MX+α2M2+β2M2X.

Menguji hipotesis mengevaluasi kebaikan yang sesuai. Memperkirakan dan dapat menunjukkan dengan cara apa model mungkin perlu diperluas: untuk memasukkan nonlinier dalam (ketika ) atau hubungan moderasi yang lebih rumit (ketika ) atau mungkin kedua. (Perhatikan bahwa tes ini tidak akan disarankan oleh perluasan rangkaian daya dari fungsi generik .)α2=β2=0α2β2(1)Mα20β20f(X,M)


Akhirnya, jika Anda menemukan bahwa koefisien interaksi tidak berbeda secara signifikan dari nol, tetapi bahwa kecocokannya adalah nonlinier (sebagaimana dibuktikan dengan nilai signifikan dari ), maka Anda akan menyimpulkan (a) ada moderasi tetapi ( b) itu tidak dimodelkan oleh istilah , tetapi sebaliknya oleh beberapa istilah tingkat tinggi yang dimulai dengan . Ini mungkin jenis fenomena yang dirujuk Kenny.β1β2MXM2X

whuber
sumber
8

Jika Anda menggunakan jumlah prediktor untuk memodelkan interaksi mereka, persamaan Anda adalah:

Y=β0+β1X+β2M+β3(X+M)+e=β0+β1X+β2M+β3X+β3M+e=β0+(β1+β3)X+(β2+β3)M+e=β0+β1X+β2M+e

di mana dan . Karenanya, model Anda tidak akan berinteraksi sama sekali. Jelas, ini bukan masalahnya dengan produk.β1=β1+β3β2=β2+β3

Ingat definisi nilai absolut:

|XM|={XM,XMMX,X<M

Meskipun Anda dapat mengurangi model ke yang hanya berisi istilah dan , menggunakan def. dari, nilai absolut adalah "bentuk moderasi khusus yang tidak mungkin realistis dalam banyak situasi", seperti yang ditunjukkan dalam komentar di bawah ini.β0+β1X+β2M+β3|XM|+eXM|XM|

Milos
sumber
1
Sebenarnya, termasukIstilah ini jelas merupakan bentuk moderasi: nilai berubah . Namun, ini adalah bentuk moderasi khusus dan terbatas yang tidak mungkin realistis dalam banyak situasi. Tidak benar untuk mengatakan bahwa model seperti itu memiliki "hanya efek utama." |XM|Mβ2
whuber
1
Ya, Anda benar,adalah bentuk moderasi, saya terbawa oleh transformasi dan akan mengedit jawaban yang sesuai. Terima kasih telah menunjukkan ini. |XM|
Milos
@ Milos: Contoh Anda tentang jumlah prediktor adalah pembuka mata, yang agak memalukan, saya harus mengatakan karena saya seharusnya sudah menyadari implikasi matematika;) whuber: Sejauh yang saya mengerti, nilai absolut hanya berguna ketika kedua variabel prediktor diukur dalam unit yang sama (misalnya dua tes psikometri, menggunakan metrik yang sama, seperti skor-z atau skor-T). Perbedaan absolut antara X dan M adalah metrik yang berguna , meskipun bukan satu-satunya yang mungkin (yaitu istilah prodcut juga bisa digunakan).
penyebut
6

Anda tidak akan menemukan bukti formal untuk menggunakan moderator multiplikatif. Anda dapat mendukung pendekatan ini dengan cara lain. Misalnya, lihat ekspansi Taylor-MacLaurin dari fungsi :f(X,M)

f(X,M)=f(0,0)+f(0,0)TT+f(0,0)MM+2f(0,0)TMTM+2f(0,0)2T2T2+2f(0,0)2M2M2

Jika Anda fungsi formulir ini ke dalam persamaan Taylor, Anda mendapatkan ini:f(X,M)=β0+βXX+βMM+βXMXM

f(X,M)=β0+βXX+βMM+βXMXM

Jadi, alasannya di sini adalah bahwa bentuk multiplikasi khusus dari moderasi ini pada dasarnya adalah pendekatan Taylor urutan kedua dari hubungan moderasi generikf(X,M)

UPDATE: jika Anda memasukkan istilah kuadrat, seperti yang disarankan @whuber maka ini akan terjadi: tancapkan ini ke Taylor:

g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2
g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2

Ini menunjukkan bahwa model baru kami dengan istilah kuadrat sesuai dengan pendekatan Taylor orde kedua penuh, tidak seperti model moderasi asli .g(X,M)f(X,M)

Aksakal
sumber
Karena dasar argumen Anda adalah ekspansi Taylor, mengapa Anda tidak memasukkan dua istilah kuadrat lainnya dan ? Benar, mereka bukan bentuk moderasi, tetapi dimasukkannya mereka dalam model biasanya akan mempengaruhi . X2M2βXM
whuber
@whuber, saya memutuskan untuk membuat posting singkat - itulah alasan utama. Kalau tidak, saya mulai menulis tentang preferensi saya untuk memasukkan istilah urutan kedua setiap kali Anda memiliki istilah lintas, lalu hentikan.
Aksakal