Setelah mengumpulkan umpan balik yang berharga dari pertanyaan dan diskusi sebelumnya, saya telah mengajukan pertanyaan berikut: Misalkan tujuannya adalah untuk mendeteksi perbedaan efek di dua kelompok, misalnya pria dan wanita. Ada dua cara untuk melakukannya:
menjalankan dua regresi terpisah untuk kedua kelompok, dan menggunakan uji Wald untuk menolak (atau tidak) hipotesis nol : , di mana adalah koefisien satu IV dalam regresi pria, dan adalah koefisien yang sama IV dalam regresi wanita.b 1 - b 2 = 0 b 1 b 2
menggabungkan kedua kelompok bersama-sama, dan menjalankan model bersama dengan memasukkan boneka gender dan istilah interaksi (IV * genderdummy). Kemudian, deteksi efek kelompok akan didasarkan pada tanda interaksi dan uji-t untuk signifikansi.
Bagaimana jika Ho ditolak dalam kasus (1), yaitu perbedaan kelompok adalah signifikan, tetapi koefisien istilah interaksi dalam kasus (2) secara statistik tidak signifikan, yaitu perbedaan kelompok tidak signifikan. Atau sebaliknya, Ho tidak ditolak dalam kasus (1), dan istilah interaksi signifikan dalam kasus (2). Saya telah berakhir dengan hasil ini beberapa kali, dan saya bertanya-tanya hasil apa yang akan lebih dapat diandalkan, dan apa alasan di balik kontradiksi ini.
Terimakasih banyak!
Jawaban:
Model pertama akan sepenuhnya berinteraksi gender dengan semua kovariat lainnya dalam model. Pada dasarnya, efek dari masing-masing kovariat (b2, b3 ... bn). Pada model kedua, efek gender hanya berinteraksi dengan IV Anda. Jadi, dengan asumsi Anda memiliki lebih banyak kovariat daripada hanya IV dan jenis kelamin, ini mungkin mendorong hasil yang agak berbeda.
Jika Anda hanya memiliki dua kovariat, ada kesempatan yang terdokumentasi di mana perbedaan maksimalisasi antara tes Wald dan tes rasio kemungkinan menyebabkan jawaban yang berbeda (lihat lebih lanjut di wikipedia ).
Dalam pengalaman saya sendiri, saya mencoba dibimbing oleh teori. Jika ada teori dominan yang menyatakan bahwa jenis kelamin hanya akan berinteraksi dengan IV, tetapi tidak dengan kovariat lainnya, saya akan memilih interaksi parsial.
sumber
Kapan saja dua prosedur berbeda digunakan untuk menguji hipotesis tertentu akan ada nilai-p yang berbeda. Mengatakan yang satu itu penting dan yang lain tidak bisa hanya membuat keputusan hitam dan putih pada tingkat 0,05. Jika satu tes memberikan nilai-p 0,03 dan yang lainnya mengatakan 0,07 saya tidak akan menyebut hasil yang bertentangan. Jika Anda akan seketat itu dalam berpikir tentang signifikansi, mudah untuk memiliki situasi (i) atau (ii) muncul ketika signifikansi papan adalah kasusnya.
Seperti yang saya sebutkan sebagai jawaban atas pertanyaan sebelumnya, preferensi saya untuk mencari interaksi adalah dengan melakukan satu regresi gabungan.
sumber
Dalam kasus kedua, perangkat lunak standar akan menyarankan Anda t-stat dengan nilai-nilai t-student sedangkan untuk kasus pertama tes Wald mungkin memiliki dua opsi. Dalam asumsi normalitas kesalahan, statistik Wald mengikuti statistik Fisher yang tepat (yang setara dengan t-stat karena mengasumsikan normalitas kesalahan). Sedangkan di bawah normalitas asimptotik, statistik Wald mengikuti distribusi Chi2 (yang analog dengan t-stat mengikuti distribusi normal secara asimptotik) Distribusi apa yang Anda asumsikan? Bergantung pada ini risiko nilai-p Anda untuk memberikan hasil yang berbeda.
Dalam Buku Teks Anda akan menemukan bahwa untuk tes tunggal bilateral (satu parameter) keduanya, statistik t-student dan Fisher adalah setara.
Jika sampel Anda tidak besar, maka membandingkan perbandingan nilai chi2 dan t-stat akan menghasilkan hasil yang berbeda. Dalam hal itu mengasumsikan dsitribusi asimptotik tidak masuk akal. JIKA sampel Anda agak kecil maka dengan asumsi normalitas tampaknya lebih masuk akal, ini menyiratkan t-stat dan nilai Fisher untuk kasus 2 dan 1 masing-masing.
sumber