Apakah pernah valid untuk memasukkan interaksi dua arah dalam suatu model tanpa menyertakan efek utama? Bagaimana jika hipotesis Anda hanya tentang interaksi, apakah Anda masih perlu memasukkan efek utama?
regression
modeling
interaction
regression-coefficients
Lembah kecil
sumber
sumber
Jawaban:
Dalam pengalaman saya, tidak hanya itu perlu untuk memiliki semua efek urutan yang lebih rendah dalam model ketika mereka terhubung ke efek urutan yang lebih tinggi, tetapi juga penting untuk memodelkan dengan benar (misalnya, memungkinkan untuk tidak linier) efek utama yang tampaknya tidak terkait dengan faktor-faktor dalam interaksi yang menarik. Itu karena interaksi antara dan dapat menjadi stand-in untuk efek utama dan . Interaksi kadang-kadang tampaknya diperlukan karena mereka collinear dengan variabel yang dihilangkan atau istilah nonlinear yang dihilangkan (misalnya, spline).x 2 x 3 x 4x1 x2 x3 x4
sumber
Anda bertanya apakah itu berlaku. Izinkan saya memberikan contoh umum, yang penjelasannya mungkin menyarankan pendekatan analitik tambahan untuk Anda.
Contoh paling sederhana dari suatu interaksi adalah model dengan satu variabel dependen dan dua variabel independen , dalam bentukX YZ X Y
dengan variabel istilah acak yang tidak memiliki ekspektasi nol, dan menggunakan parameter dan . Seringkali ada gunanya memeriksa apakah kira kira , karena ekspresi yang secara aljabar setara dari model yang sama adalaha , β ' , γ ' , δ ' δ ' β ' γ 'ε α,β′,γ′, δ′ δ′ β′γ′
(di mana , dll).β′=αβ
Dari mana, jika ada alasan untuk mengira , kita dapat menyerapnya dalam istilah kesalahan . Ini tidak hanya memberikan "interaksi murni", tetapi juga tanpa istilah yang konstan. Ini pada gilirannya sangat menyarankan untuk mengambil logaritma. Beberapa heteroskedastisitas dalam residu - yaitu, kecenderungan residu yang terkait dengan nilai lebih besar lebih besar dalam nilai absolut daripada rata-rata - juga akan menunjukkan arah ini. Kami kemudian ingin mengeksplorasi formulasi alternatifε Z(δ−βγ)∼0 ε Z
dengan kesalahan acak iid . Lebih jauh, jika kita mengharapkan dan menjadi besar dibandingkan dengan , kita hanya akan mengusulkan modelβ X γ Y 1τ βX γY 1
Model baru ini hanya memiliki satu parameter alih-alih empat parameter ( , , dll.) Yang tunduk pada hubungan kuadratik ( ), penyederhanaan yang cukup besar.α β ′ δ ′ = β ′ γ ′η α β′ δ′=β′γ′
Saya tidak mengatakan bahwa ini perlu atau bahkan satu-satunya langkah yang harus diambil, tetapi saya menyarankan bahwa penataan ulang aljabar model seperti ini biasanya layak dipertimbangkan setiap kali interaksi saja tampak signifikan.
Beberapa cara luar biasa untuk mengeksplorasi model dengan interaksi, terutama dengan hanya dua dan tiga variabel independen, muncul dalam bab 10 - 13 dari Tukey's EDA .
sumber
Meskipun sering dinyatakan dalam buku teks bahwa seseorang tidak boleh memasukkan interaksi dalam model tanpa efek utama yang sesuai, ada contoh di mana ini akan masuk akal. Saya akan memberi Anda contoh paling sederhana yang bisa saya bayangkan.
Misalkan subyek secara acak ditugaskan untuk dua kelompok diukur dua kali, sekali pada awal (yaitu, tepat setelah pengacakan) dan satu kali setelah kelompok T menerima beberapa jenis pengobatan, sedangkan kelompok C tidak. Kemudian model tindakan berulang untuk data ini akan mencakup efek utama untuk kesempatan pengukuran (variabel dummy yaitu 0 untuk awal dan 1 untuk tindak lanjut) dan istilah interaksi antara dummy kelompok (0 untuk C, 1 untuk T ) dan waktu dummy.
Model mencegat kemudian memperkirakan skor rata-rata subjek pada awal (terlepas dari kelompok mereka berada di). Koefisien untuk dummy kesempatan pengukuran menunjukkan perubahan pada kelompok kontrol antara awal dan tindak lanjut. Dan koefisien untuk istilah interaksi menunjukkan seberapa besar / kecil perubahan itu pada kelompok perlakuan dibandingkan dengan kelompok kontrol.
Di sini, tidak perlu untuk memasukkan efek utama untuk kelompok, karena pada awal, kelompok-kelompok tersebut setara dengan definisi karena pengacakan.
Orang tentu saja dapat berpendapat bahwa efek utama untuk kelompok masih harus dimasukkan, sehingga, jika pengacakan gagal, ini akan diungkapkan oleh analisis. Namun, itu setara dengan menguji sarana dasar dari dua kelompok terhadap satu sama lain. Dan ada banyak orang yang tidak menyukai pengujian untuk perbedaan awal dalam studi acak (tentu saja, ada juga banyak yang merasa bermanfaat, tetapi ini adalah masalah lain).
sumber
Alasan untuk menjaga efek utama dalam model adalah untuk pengidentifikasian. Oleh karena itu, jika tujuannya adalah kesimpulan statistik tentang masing-masing efek, Anda harus menyimpan efek utama dalam model. Namun, jika tujuan pemodelan Anda semata-mata untuk memprediksi nilai-nilai baru, maka sangat sah untuk hanya menyertakan interaksi jika itu meningkatkan akurasi prediksi.
sumber
ini tersirat dalam banyak jawaban yang diberikan orang lain tetapi intinya adalah bahwa model dengan istilah produk tetapi tanpa moderator & prediktor hanyalah model yang berbeda. Cari tahu apa artinya masing-masing mengingat proses yang Anda modelkan dan apakah model tanpa moderator & prediktor lebih masuk akal mengingat teori atau hipotesis Anda. Pengamatan bahwa istilah produk signifikan tetapi hanya ketika moderator & prediktor tidak dimasukkan tidak memberi tahu Anda apa-apa (kecuali mungkin bahwa Anda memancing untuk "signifikansi") tanpa penjelasan yang masuk akal mengapa masuk akal untuk meninggalkannya .
sumber
Bisa dibilang, itu tergantung pada apa Anda menggunakan model untuk. Tetapi saya belum pernah melihat alasan untuk tidak menjalankan dan mendeskripsikan model dengan efek utama, bahkan dalam kasus di mana hipotesisnya hanya tentang interaksi.
sumber
Saya akan meminjam paragraf dari buku Pengantar analisis survival menggunakan Stata oleh M.Cleves, R.Gutierrez, W.Gould, Y.Marchenko diedit oleh Stata tekan untuk menjawab pertanyaan Anda.
sumber
Baik x dan y akan dikorelasikan dengan xy (kecuali Anda telah mengambil tindakan khusus untuk mencegah hal ini dengan menggunakan pemusatan). Jadi, jika Anda memperoleh efek interaksi yang substansial dengan pendekatan Anda, kemungkinan akan berjumlah satu atau lebih efek utama yang menyamar sebagai interaksi. Ini tidak akan menghasilkan hasil yang jelas dan dapat ditafsirkan. Yang diinginkan adalah sebaliknya untuk melihat seberapa banyak interaksi dapat menjelaskan di atas dan di atas apa efek utama dilakukan, dengan memasukkan x , y , dan (lebih disukai dalam langkah berikutnya) xy .
Mengenai istilah: ya, β 0 disebut "konstan." Di sisi lain, "parsial" memiliki makna khusus dalam regresi dan jadi saya tidak akan menggunakan istilah itu untuk menggambarkan strategi Anda di sini.
Beberapa contoh menarik yang akan muncul sekali di bulan biru dijelaskan di utas ini .
sumber
Saya akan menyarankan itu hanyalah kasus khusus ketidakpastian model. Dari perspektif Bayesian, Anda hanya memperlakukan ini dengan cara yang persis sama dengan Anda memperlakukan segala jenis ketidakpastian lainnya, dengan cara:
Dan Anda dapat melihat dari sini bahwa adalah "kesimpulan bersyarat" dari hipotesis di bawah model ke-m (ini biasanya semua yang dipertimbangkan, untuk model "terbaik" yang dipilih. ). Perhatikan bahwa analisis standar ini dibenarkan setiap kali - model "jelas terbaik" - atau setiap kali - semua model memberikan kesimpulan yang sama / mirip. Namun jika tidak ada yang terpenuhi, maka Teorema Bayes mengatakan prosedur terbaik adalah untuk rata-rata hasilnya, menempatkan bobot yang lebih tinggi pada model yang paling didukung oleh data dan informasi sebelumnya.P ( M m | D I ) ≈ 1 P ( H i n t | D M j I ) ≈ P ( H i n t | D M k I )P(Hint|DMmI) P(Mm|DI)≈1 P(Hint|DMjI)≈P(Hint|DMkI)
sumber
Sangat jarang ide yang baik untuk memasukkan istilah interaksi tanpa efek utama yang terlibat di dalamnya. David Rindskopf dari CCNY telah menulis beberapa makalah tentang kejadian langka itu.
sumber
Ada berbagai proses di alam yang hanya melibatkan efek interaksi dan hukum yang menggambarkannya. Misalnya hukum Ohm. Dalam psikologi Anda memiliki misalnya model kinerja Vroom (1964): Kinerja = Kemampuan x Motivasi. Sekarang, Anda mungkin berharap menemukan efek interaksi yang signifikan ketika hukum ini benar. Dengan menyesal, ini bukan masalahnya. Anda mungkin dengan mudah menemukan dua efek utama dan efek interaksi yang tidak signifikan (untuk demonstrasi dan penjelasan lebih lanjut lihat Landsheer, van den Wittenboer dan Maassen (2006), Social Science Research 35, 274-294). Model linear tidak cocok untuk mendeteksi efek interaksi; Ohm mungkin tidak pernah menemukan hukumnya ketika dia menggunakan model linier.
Akibatnya, menafsirkan efek interaksi dalam model linier menjadi sulit. Jika Anda memiliki teori yang memprediksi efek interaksi, Anda harus memasukkannya meskipun tidak signifikan. Anda mungkin ingin mengabaikan efek utama jika teori Anda mengecualikannya, tetapi Anda akan menemukan itu sulit, karena efek utama yang signifikan sering ditemukan dalam kasus mekanisme penghasil data sejati yang hanya memiliki efek multiplikasi.
Jawaban saya adalah: Ya, bisa berlaku untuk memasukkan interaksi dua arah dalam model tanpa menyertakan efek utama. Model linier adalah alat yang sangat baik untuk memperkirakan hasil dari berbagai macam mekanisme penghasil data, tetapi formula mereka tidak dapat dengan mudah diartikan sebagai deskripsi yang valid dari mekanisme penghasil data.
sumber
Yang ini rumit dan terjadi pada saya di proyek terakhir saya. Saya akan menjelaskannya dengan cara ini: katakanlah Anda memiliki variabel A dan B yang keluar signifikan secara independen dan dari segi bisnis Anda berpikir bahwa interaksi A dan B tampaknya baik. Anda memasukkan interaksi yang keluar menjadi signifikan tetapi B kehilangan signifikansinya. Anda akan menjelaskan model Anda pada awalnya dengan menunjukkan dua hasil. Hasilnya akan menunjukkan bahwa awalnya B adalah signifikan tetapi ketika dilihat dalam terang A kehilangan kemilau nya. Jadi B adalah variabel yang baik tetapi hanya jika dilihat dari berbagai tingkat A (jika A adalah variabel kategori). Seperti mengatakan Obama adalah pemimpin yang baik jika dilihat dari sudut pandang tentara SEAL-nya. Jadi cap Obama * akan menjadi variabel yang signifikan. Namun Obama ketika dilihat sendiri mungkin tidak sepenting itu. (Jangan tersinggung Obama, hanya sebuah contoh.)
sumber
F = m * a, gaya sama dengan percepatan kali massa.
Itu tidak direpresentasikan sebagai F = m + a + ma, atau kombinasi linear lainnya dari parameter tersebut. Memang, hanya interaksi antara massa dan akselerasi yang akan masuk akal secara fisik.
sumber
Ya itu bisa valid dan bahkan perlu. Jika misalnya dalam 2. Anda akan memasukkan faktor untuk efek utama (perbedaan rata-rata kondisi biru vs merah) ini akan membuat model lebih buruk.
Hipotesis Anda mungkin benar independen di mana ada efek utama. Tetapi model tersebut mungkin membutuhkannya untuk menggambarkan proses yang mendasarinya. Jadi ya, Anda harus mencoba dengan dan tanpa.
Catatan: Anda harus memusatkan kode untuk variabel independen "kontinu" (pengukuran dalam contoh). Kalau tidak, koefisien interaksi dalam model tidak akan didistribusikan secara simetris (tidak ada koefisien untuk pengukuran pertama dalam contoh).
sumber
Jika variabel yang dipermasalahkan bersifat kategorikal, maka termasuk interaksi tanpa efek utama hanyalah reparameterisasi model, dan pilihan parameterisasi tergantung pada apa yang ingin Anda capai dengan model Anda. Berinteraksi variabel kontinu dengan variabel kontinyu lainnya dengan variabel kategori adalah cerita yang berbeda. Lihat: lihat faq ini dari Lembaga Penelitian dan Pendidikan Digital UCLA
sumber
Ya ini bisa valid, meskipun jarang. Tetapi dalam hal ini Anda masih perlu memodelkan efek utama, yang selanjutnya akan Anda kemunduran.
Memang, dalam beberapa model, hanya interaksi yang menarik, seperti pengujian obat / model klinis. Ini misalnya adalah dasar dari model Generalized PsychoPhysiological Interaksi (gPPI) model: di
y = ax + bxh + ch
manax/y
voxels / daerah yang menarik danh
desain blok / peristiwa.Dalam model ini, keduanya
a
danc
akan mundur, hanyab
akan disimpan untuk inferensi (koefisien beta). Memang, keduanyaa
danc
mewakili aktivitas palsu dalam kasus kami, dan hanyab
mewakili apa yang tidak bisa dijelaskan oleh aktivitas palsu, interaksi dengan tugas.sumber
Jawaban singkatnya: Jika Anda memasukkan interaksi dalam efek tetap, maka efek utama secara otomatis termasuk apakah Anda secara spesifik memasukkannya ke dalam kode Anda . Satu-satunya perbedaan adalah parametrization Anda, yaitu, apa arti parameter dalam model Anda (misalnya, apakah mereka berarti kelompok atau apakah mereka berbeda dari tingkat referensi).
Saya baru saja melihat bahwa David Beede memberikan jawaban yang sangat mirip (permintaan maaf), tetapi saya pikir saya akan menyerahkan ini kepada mereka yang menanggapi dengan baik perspektif aljabar linier.
sumber