Ini tampaknya menjadi masalah mendasar, tetapi saya baru sadar bahwa saya sebenarnya tidak tahu bagaimana cara menguji kesetaraan koefisien dari dua regresi yang berbeda. Adakah yang bisa menjelaskan ini?
Secara lebih formal, misalkan saya menjalankan dua regresi berikut: dan mana merujuk ke matriks desain regresi , dan ke vektor koefisien dalam regresi . Perhatikan bahwa dan berpotensi sangat berbeda, dengan dimensi yang berbeda, dll. Saya tertarik misalnya apakah .y 2 = X 2 β 2 + ε 2 X i i β i i X 1 X 2 β 11 ≠ β 21
Jika ini berasal dari regresi yang sama, ini akan sepele. Tetapi karena mereka berasal dari yang berbeda, saya tidak yakin bagaimana melakukannya. Adakah yang punya ide atau bisa memberi saya beberapa petunjuk?
Masalah saya secara terperinci: Intuisi pertama saya adalah melihat interval kepercayaan, dan jika tumpang tindih, maka saya akan mengatakan mereka pada dasarnya sama. Prosedur ini tidak datang dengan ukuran tes yang benar, meskipun (yaitu setiap interval kepercayaan individu memiliki , katakanlah, tetapi melihat mereka bersama-sama tidak akan memiliki probabilitas yang sama). Intuisi "kedua" saya adalah melakukan uji-t normal. Yaitu, ambil
di mana diambil sebagai nilai hipotesis nol saya. Namun, ini tidak memperhitungkan ketidakpastian estimasi , dan jawabannya mungkin tergantung pada urutan regresi (yang saya sebut 1 dan 2). β 21
Gagasan ketiga saya adalah melakukannya seperti dalam uji standar untuk persamaan dua koefisien dari regresi yang sama, yaitu take
Komplikasi muncul karena keduanya berasal dari regresi yang berbeda. Catat itu
Ini mendorong saya untuk mengajukan pertanyaan ini di sini. Ini harus menjadi prosedur standar / tes standar, tetapi saya tidak dapat menemukan apa pun yang cukup mirip dengan masalah ini. Jadi, jika ada yang bisa mengarahkan saya ke prosedur yang benar, saya akan sangat berterima kasih!
sumber
Jawaban:
Meskipun ini bukan analisis umum, itu benar-benar menarik. Jawaban yang diterima cocok dengan cara Anda mengajukan pertanyaan, tetapi saya akan memberikan teknik lain yang cukup diterima yang mungkin setara atau tidak (saya akan menyerahkan pikiran yang lebih baik untuk mengomentari itu).
Pendekatan ini menggunakan tes Z berikut:
Di mana adalah kesalahan standar .βSEβ β
Persamaan ini disediakan oleh Clogg, CC, Petkova, E., & Haritou, A. (1995). Metode statistik untuk membandingkan koefisien regresi antara model. American Journal of Sociology , 100 (5), 1261-1293. dan dikutip oleh Paternoster, R., Brame, R., Mazerolle, P., & Piquero, A. (1998). Menggunakan uji statistik yang benar untuk persamaan koefisien regresi. Kriminologi , 36 (4), 859-866. persamaan 4, yang tersedia gratis dari paywall. Saya telah mengadaptasi formula Peternoster untuk menggunakan daripadab ββ b karena ada kemungkinan bahwa Anda mungkin tertarik pada DV yang berbeda karena alasan yang mengerikan dan ingatan saya tentang Clogg dkk. adalah bahwa rumus mereka menggunakan . Saya juga ingat memeriksa silang rumus ini terhadap Cohen, Cohen, Barat, dan Aiken, dan akar pemikiran yang sama dapat ditemukan di sana dalam interval kepercayaan perbedaan antara koefisien, persamaan 2.8.6, hal 46-47.β
sumber
Untuk orang-orang dengan pertanyaan serupa, izinkan saya memberikan garis besar jawaban yang sederhana.
Ini akan mengarah ke matriks varians-kovarians yang memungkinkan untuk menguji kesetaraan dari kedua koefisien.
sumber
expand =2, generate(indicator); generate y = cond(indicator, y2, y1); regress y i.indicator##c.X, vce(cluster id);
Menggunakan akun standar kesalahan berkerumun untuk fakta bahwa e1 dan e2 tidak independen untuk pengamatan yang sama setelah menumpuk dataset.(Clogg, CC, Petkova, E., & Haritou, A. (1995). Metode statistik untuk membandingkan koefisien regresi antara model. American Journal of Sociology, 100 (5), 1261-1293.) Menyajikan jawaban dalam kasus khusus persamaan bersarang (mis. untuk mendapatkan persamaan kedua, pertimbangkan persamaan pertama dan tambahkan beberapa variabel penjelas) Mereka mengatakan itu mudah untuk diterapkan.
Jika saya memahaminya, dalam kasus khusus ini, tes Haussman juga dapat diimplementasikan. Perbedaan utama adalah bahwa tes mereka menganggap benar persamaan kedua (penuh), sedangkan tes Haussman menganggap benar persamaan pertama.
Perhatikan bahwa Clogg et al (1995) tidak cocok untuk data panel. Tetapi tes mereka telah digeneralisasi oleh (Yan, J., Aseltine Jr, RH, & Harel, O. (2013). Membandingkan koefisien regresi antara model linear bersarang untuk data cluster dengan data estimasi umum. Jurnal Statistik Pendidikan dan Perilaku, 38 (2), 172-189.) Dengan paket yang disediakan di R: geepack Lihat: https://www.jstor.org/stable/pdf/41999419.pdf?refreqid=excelsior%3Aa0a3b20f2bc68223edb59e3254c234be&seq=1
Dan (untuk paket-R): https://cran.r-project.org/web/packages/geepack/index.html
sumber