Bagaimana menafsirkan efek utama ketika efek interaksi tidak signifikan?

21

Saya menjalankan Generalized Linear Mixed Model dalam R dan memasukkan efek interaksi antara dua prediktor. Interaksi itu tidak signifikan, tetapi efek utama (dua prediktor) keduanya. Sekarang banyak contoh buku teks memberi tahu saya bahwa jika ada efek interaksi yang signifikan, efek utama tidak dapat ditafsirkan. Tetapi bagaimana jika interaksi Anda tidak signifikan?

Dapatkah saya menyimpulkan bahwa kedua prediktor berpengaruh pada respons? Atau lebih baik menjalankan model baru di mana saya meninggalkan interaksi? Saya lebih suka untuk tidak melakukannya, karena saya kemudian harus mengendalikan beberapa pengujian.

rozemarijn
sumber
ya maksud saya tidak signifikan
rozemarijn
4
Jika salah satu dari jawaban ini cocok untuk Anda, mungkin Anda dapat menerimanya atau meminta klarifikasi.
conjugateprior
Jika interaksi tidak signifikan, maka Anda harus membuangnya dan menjalankan regresi tanpa itu.
Aksakal

Jawaban:

21

Sedikit niggle

'Sekarang banyak contoh buku teks memberi tahu saya bahwa jika ada efek signifikan dari interaksi, efek utama tidak dapat ditafsirkan'

Saya harap itu tidak benar. Mereka harus mengatakan bahwa jika ada istilah interaksi, katakanlah antara X dan Z yang disebut XZ, maka interpretasi dari koefisien individu untuk X dan untuk Z tidak dapat ditafsirkan dengan cara yang sama seperti jika XZ tidak ada. Anda pasti bisa menafsirkannya.

Pertanyaan 2

Jika interaksi tersebut masuk akal secara teoretis maka tidak ada alasan untuk tidak membiarkannya masuk, kecuali kekhawatiran akan efisiensi statistik karena alasan tertentu mengesampingkan kekhawatiran tentang kesalahan spesifikasi dan membiarkan teori dan model Anda berbeda.

Karena Anda telah meninggalkannya, maka tafsirkan model Anda menggunakan efek marginal dengan cara yang sama seolah-olah interaksi itu signifikan. Untuk referensi, saya menyertakan tautan ke Brambor, Clark dan Golder (2006) yang menjelaskan cara menafsirkan model interaksi dan cara menghindari perangkap umum.

Pikirkan seperti ini: Anda sering memiliki variabel kontrol dalam model yang ternyata tidak menjadi signifikan, tetapi Anda tidak (atau tidak seharusnya) memotongnya pada tanda pertama bintang yang hilang.

pertanyaan 1

Anda bertanya apakah Anda dapat 'menyimpulkan bahwa kedua prediktor berpengaruh pada respons?' Tampaknya Anda bisa, tetapi Anda juga bisa melakukan yang lebih baik. Untuk model dengan istilah interaksi Anda dapat melaporkan apa efek dua prediktor sebenarnya memiliki terhadap variabel dependen (efek marginal) dengan cara yang acuh tak acuh apakah interaksi signifikan, atau bahkan hadir dalam model.

Garis bawah

Jika Anda menghapus interaksi, Anda menentukan ulang model. Ini mungkin merupakan hal yang masuk akal untuk dilakukan karena berbagai alasan, beberapa teori dan beberapa statistik, tetapi membuatnya lebih mudah untuk menafsirkan koefisien bukan salah satunya.

conjugateprior
sumber
2
Yakin. Dan jika Anda berada di R maka Anda mungkin menemukan paket effectslebih mudah daripada bekerja dengan cara Anda melalui matematika, dan juga untuk generalisasi ke model yang lebih kompleks.
conjugateprior
1
Pada intinya Anda tergantung pada apa yang Anda maksud dengan 'lebih mudah'.
John
Terima kasih banyak untuk referensi Brambor, Clark dan Golder (2006)! Ini sangat masuk akal dalam menjelaskan model interaksi. Sangat berguna untuk memahami bagaimana menafsirkan (atau TIDAK) koefisien dalam model seperti itu ... BTW, makalah ini dilengkapi dengan lampiran internet: Model Interaksi Multiplikatif , yang hadir sebagai tinjauan diskusi yang sangat berguna.
landroni
11

Jika Anda ingin efek utama tanpa syarat maka ya Anda ingin menjalankan model baru tanpa istilah interaksi karena istilah interaksi itu tidak memungkinkan Anda untuk melihat efek utama tanpa syarat Anda dengan benar. Efek utama yang dihitung dengan hadir interaksi berbeda dari efek utama karena orang biasanya menafsirkannya dalam sesuatu seperti ANOVA. Misalnya, dimungkinkan untuk memiliki interaksi yang sepele dan tidak signifikan yang efek utamanya tidak akan terlihat ketika interaksi ada dalam model.

Katakanlah Anda memiliki dua prediktor, A dan B. Ketika Anda memasukkan istilah interaksi maka besarnya A dibolehkan bervariasi tergantung pada B dan sebaliknya. Koefisien beta yang dilaporkan dalam output regresi untuk A kemudian hanyalah salah satu dari banyak nilai yang mungkin. Standarnya adalah menggunakan koefisien A untuk kasus ketika B adalah 0 dan istilah interaksi adalah 0. Tapi, ketika regresi hanya aditif, A tidak diperbolehkan bervariasi di seluruh B dan Anda hanya mendapatkan efek utama A independen dari B. Ini bisa menjadi nilai yang sangat berbeda bahkan jika interaksi itu sepele karena mereka memiliki arti yang berbeda. Model aditif adalah satu-satunya cara untuk benar-benar menilai efek utama dengan sendirinya. Di sisi lain, ketika interaksi Anda bermakna (secara teoritis, bukan secara statistik) dan Anda ingin menyimpannya dalam model Anda maka satu-satunya cara untuk menilai A adalah melihatnya di seluruh level B. Itu sebenarnya jenis hal yang harus Anda pertimbangkan sehubungan dengan interaksi, bukan apakah A signifikan. Anda hanya dapat benar-benar melihat apakah ada efek tanpa syarat dari A dalam model aditif.

Jadi, para model melihat hal-hal yang sangat berbeda dan ini bukan masalah pengujian berganda. Anda harus melihat keduanya. Anda tidak memutuskan berdasarkan signifikansi. Efek utama terbaik untuk melaporkan adalah dari model aditif. Anda membuat keputusan tentang menyertakan atau menyajikan interaksi tidak signifikan berdasarkan masalah teoretis, atau masalah penyajian data, dll.

(Ini bukan untuk mengatakan bahwa tidak ada masalah pengujian ganda yang potensial di sini. Tetapi apa yang mereka maksudkan sangat bergantung pada teori yang mendorong pengujian.)

John
sumber
Saya pikir perhatian @ rozemarijn lebih pada 'perjalanan memancing', yaitu menjalankan banyak model yang berbeda fungsi dari bagaimana bintang terakhir muncul, daripada beberapa pengujian dalam arti teknis
conjugateprior
1
Anda dapat menjalankan semua model yang Anda inginkan. Hanya menghitung model bukanlah ujian. Tes adalah prosedur logis, bukan matematika. Fakta bahwa banyak perangkat lunak secara default mengembalikan nilai-p untuk estimasi parameter seolah-olah Anda telah melakukan semacam tes tidak berarti salah satunya.
John
Dan untuk menambah apa yang dikatakan di atas, orang mungkin sering melakukan tes secara implisit menyadari bahwa mereka akan gagal atau lulus. Tes-tes tersebut dihitung terhadap spelunking data sebanyak yang dihitung.
John
7

Jika efek utama signifikan tetapi bukan interaksi Anda cukup menafsirkan efek utama, seperti yang Anda sarankan.

Anda tidak perlu menjalankan model lain tanpa interaksi (umumnya bukan saran terbaik untuk mengecualikan parameter berdasarkan signifikansi, ada banyak jawaban di sini membahas hal itu). Ambil saja hasilnya apa adanya.

Henrik
sumber
1
Apakah Anda akan memberikan saran yang sama pada paragraf kedua jika OP mengindikasikan bahwa interaksi tersebut tidak diharapkan terjadi secara teoritis tetapi dimasukkan dalam model sebagai uji goodness of fit?
whuber
Terima kasih banyak atas reaksi cepat ini. Namun, tampaknya ada beberapa perbedaan pendapat ... John berpendapat bahwa saya harus menjalankan model baru tanpa efek interaksi karena "Efek utama yang dihitung dengan hadir interaksi berbeda dari efek utama sebenarnya."
rozemarijn
Namun, Henrik berpendapat saya tidak harus menjalankan model baru. Mungkin saya dapat membuat keputusan jika saya tahu mengapa efek utama yang dihitung dengan istilah interaksi berbeda dari efek utama yang sebenarnya ...
rozemarijn
Sebagai reaksi terhadap whuber interaksi diharapkan terjadi secara teoritis dan tidak dimasukkan sebagai uji goodness of fit.
rozemarijn
1
Untuk menguraikan sedikit: perbedaan utama adalah antara gagasan efek dari parameter . Efek adalah fitur dari model secara keseluruhan, yang mungkin atau mungkin juga tidak dapat diidentifikasi sebagai parameter tertentu. Ketika model linier dan tidak ada interaksi, mereka dapat diidentifikasi, tetapi ketika ada interaksi mereka tidak bisa. Klaim saya pada dasarnya adalah bahwa jika dipaksa untuk memilih, seperti Anda, bahwa Anda harus lebih peduli tentang efek daripada tentang parameter. Dan jika Anda melakukan itu, Anda tidak lagi peduli persis berapa banyak yang terakhir yang Anda butuhkan untuk menghasilkan yang pertama.
conjugateprior