Model gabungan dengan istilah interaksi vs regresi terpisah untuk perbandingan grup

13

Setelah mengumpulkan umpan balik yang berharga dari pertanyaan dan diskusi sebelumnya, saya telah mengajukan pertanyaan berikut: Misalkan tujuannya adalah untuk mendeteksi perbedaan efek di dua kelompok, misalnya pria dan wanita. Ada dua cara untuk melakukannya:

  1. menjalankan dua regresi terpisah untuk kedua kelompok, dan menggunakan uji Wald untuk menolak (atau tidak) hipotesis nol : , di mana adalah koefisien satu IV dalam regresi pria, dan adalah koefisien yang sama IV dalam regresi wanita.b 1 - b 2 = 0 b 1 b 2H0b1b2=0b1b2

  2. menggabungkan kedua kelompok bersama-sama, dan menjalankan model bersama dengan memasukkan boneka gender dan istilah interaksi (IV * genderdummy). Kemudian, deteksi efek kelompok akan didasarkan pada tanda interaksi dan uji-t untuk signifikansi.

Bagaimana jika Ho ditolak dalam kasus (1), yaitu perbedaan kelompok adalah signifikan, tetapi koefisien istilah interaksi dalam kasus (2) secara statistik tidak signifikan, yaitu perbedaan kelompok tidak signifikan. Atau sebaliknya, Ho tidak ditolak dalam kasus (1), dan istilah interaksi signifikan dalam kasus (2). Saya telah berakhir dengan hasil ini beberapa kali, dan saya bertanya-tanya hasil apa yang akan lebih dapat diandalkan, dan apa alasan di balik kontradiksi ini.

Terimakasih banyak!

Bill718
sumber
1
perbedaan antara prosedur adalah bahwa orang mengasumsikan varians yang sama untuk kedua kelompok. Analisis terpisah mengasumsikan varian yang berbeda.
probabilityislogic
Terima kasih banyak! Apakah Anda mengetahui adanya referensi yang membahas masalah varian saat membandingkan model yang berbeda?
Bill718

Jawaban:

7

Model pertama akan sepenuhnya berinteraksi gender dengan semua kovariat lainnya dalam model. Pada dasarnya, efek dari masing-masing kovariat (b2, b3 ... bn). Pada model kedua, efek gender hanya berinteraksi dengan IV Anda. Jadi, dengan asumsi Anda memiliki lebih banyak kovariat daripada hanya IV dan jenis kelamin, ini mungkin mendorong hasil yang agak berbeda.

Jika Anda hanya memiliki dua kovariat, ada kesempatan yang terdokumentasi di mana perbedaan maksimalisasi antara tes Wald dan tes rasio kemungkinan menyebabkan jawaban yang berbeda (lihat lebih lanjut di wikipedia ).

Dalam pengalaman saya sendiri, saya mencoba dibimbing oleh teori. Jika ada teori dominan yang menyatakan bahwa jenis kelamin hanya akan berinteraksi dengan IV, tetapi tidak dengan kovariat lainnya, saya akan memilih interaksi parsial.

mCorey
sumber
Terima kasih! Ya, sebenarnya ada berbagai kovariat, tidak hanya satu IV, saya hanya menyebutkan satu IV dalam pertanyaan untuk kesederhanaan. Masalahnya adalah bahwa tidak ada teori kuat yang dapat mendukung interaksi antara gender dan kovariat tertentu, itu adalah analisis eksplorasi, jadi saya perlu bereksperimen dengan banyak interaksi dan kecocokan model; model awal berisi 30 prediksi ...
Bill718
@ Bill718 Juga model terpisah akan memiliki intersep yang berbeda, sedangkan model tunggal tidak akan, kecuali jika Anda menentukan jenis kelamin saja sebagai IV tambahan (bukan hanya sebagai interaksi).
Robert Kubrick
5

Kapan saja dua prosedur berbeda digunakan untuk menguji hipotesis tertentu akan ada nilai-p yang berbeda. Mengatakan yang satu itu penting dan yang lain tidak bisa hanya membuat keputusan hitam dan putih pada tingkat 0,05. Jika satu tes memberikan nilai-p 0,03 dan yang lainnya mengatakan 0,07 saya tidak akan menyebut hasil yang bertentangan. Jika Anda akan seketat itu dalam berpikir tentang signifikansi, mudah untuk memiliki situasi (i) atau (ii) muncul ketika signifikansi papan adalah kasusnya.

Seperti yang saya sebutkan sebagai jawaban atas pertanyaan sebelumnya, preferensi saya untuk mencari interaksi adalah dengan melakukan satu regresi gabungan.

Michael R. Chernick
sumber
Ya, memang benar bahwa regresi gabungan tampaknya berkinerja lebih baik, setidaknya dalam kasus saya, dan ini adalah metode yang sangat fleksibel, karena seseorang dapat mencoba dengan berbagai interaksi dan model yang sesuai. Saya hanya ingin, dengan rasa ingin tahu "statistik", katakanlah , untuk mencari tahu apa alasan di balik hasil yang entah bagaimana berbeda. Mengenai nilai-p, saya telah mendengar beberapa orang menerima signifikansi hanya pada tingkat = 0,5% atau kurang. Saya lebih fleksibel, menggunakan level = 1%, tetapi sakit kepala besar muncul ketika nilai-p benar-benar berbeda.
Bill718
Saya telah melihat studi misalnya, di mana satu IV sangat signifikan ketika modet logit yang dipesan digunakan, sedangkan IV yang sama menjadi tidak signifikan ketika OLS diterapkan. Jadi, dalam hal itu, penjelasan tentang hasilnya bisa sedikit rumit. Terima kasih banyak atas komentar dan umpan balik Anda!
Bill718
0.070.03
2

Dalam kasus kedua, perangkat lunak standar akan menyarankan Anda t-stat dengan nilai-nilai t-student sedangkan untuk kasus pertama tes Wald mungkin memiliki dua opsi. Dalam asumsi normalitas kesalahan, statistik Wald mengikuti statistik Fisher yang tepat (yang setara dengan t-stat karena mengasumsikan normalitas kesalahan). Sedangkan di bawah normalitas asimptotik, statistik Wald mengikuti distribusi Chi2 (yang analog dengan t-stat mengikuti distribusi normal secara asimptotik) Distribusi apa yang Anda asumsikan? Bergantung pada ini risiko nilai-p Anda untuk memberikan hasil yang berbeda.

Dalam Buku Teks Anda akan menemukan bahwa untuk tes tunggal bilateral (satu parameter) keduanya, statistik t-student dan Fisher adalah setara.

Jika sampel Anda tidak besar, maka membandingkan perbandingan nilai chi2 dan t-stat akan menghasilkan hasil yang berbeda. Dalam hal itu mengasumsikan dsitribusi asimptotik tidak masuk akal. JIKA sampel Anda agak kecil maka dengan asumsi normalitas tampaknya lebih masuk akal, ini menyiratkan t-stat dan nilai Fisher untuk kasus 2 dan 1 masing-masing.

JDav
sumber
Memang, saya memiliki dua sampel dengan ukuran yang tidak sama, yang pertama memiliki 3000 pengamatan, tetapi yang kedua relatif kecil, 500 pengamatan. Dan perangkat lunak melaporkan chi-square ketika menghitung statistik Wald. Jadi, tampaknya inilah alasan ketidaksesuaian. Kedua sampel didistribusikan secara normal, terutama dalam kasus sampel besar. Terimakasih banyak!
Bill718
1
Kami minta maaf telah menipu Anda tetapi ukuran subsampel yang tidak sama tidak menjadi masalah. Apalagi milikmu terlihat seperti sampel besar bagiku. jadi kedua prosedur harus menghasilkan hasil yang serupa. Saya perhatikan bahwa @probabilityislogic membuat poin yang bagus. Menggunakan satu kumpulan sampel menyiratkan varians residual yang sama, sehingga dapat menjadi sumber heterogenitas. Tidak tahu bagaimana Anda menerapkan prosedur regresi terpisah, tetapi mudah untuk membuat kesalahan jika Anda menghitung sendiri stat. Ini membuat regresi yang dikumpulkan menjadi pendekatan langsung yang aman.
JDav
1
Untuk menyelesaikan masalah varians tidak merata di seluruh grup (heterosckedastisitas) cobalah White (alias Newey-west, Sandwich atau Robust jika Anda menggunakan penaksir varians stata). Pendekatan ini mengoreksi jenis heteroscedascity yang tidak diketahui.
JDav
Oh, ok, saya melihat, sebenarnya pengamatan dalam sampel berasal dari berbagai daerah di suatu negara, jadi sangat mungkin saya kira masalah heterogenitas ada!
Bill718