Saya berharap seseorang dapat membantu meluruskan titik kebingungan bagi saya. Katakanlah saya ingin menguji apakah 2 set koefisien regresi secara signifikan berbeda satu sama lain, dengan pengaturan berikut:
- , dengan 5 variabel independen.
- 2 grup, dengan ukuran yang kira-kira sama (meskipun ini mungkin bervariasi)
- Ribuan regresi serupa akan dilakukan secara bersamaan, sehingga beberapa jenis koreksi hipotesis harus dilakukan.
Salah satu pendekatan yang disarankan kepada saya adalah menggunakan tes-Z:
Lain yang saya lihat disarankan di papan ini adalah untuk memperkenalkan variabel dummy untuk pengelompokan dan menulis ulang model sebagai:
, di mana adalah variabel pengelompokan, dikodekan sebagai 0, 1.
Pertanyaan saya adalah, bagaimana kedua pendekatan ini berbeda (mis. Asumsi yang berbeda dibuat, fleksibilitas)? Apakah yang satu lebih pantas daripada yang lain? Saya menduga ini cukup mendasar, tetapi klarifikasi apa pun akan sangat dihargai.
Jawaban:
Kedua pendekatan itu berbeda.
Biarkan estimasi kesalahan standar dari dua regresi menjadi dan s 2 . Kemudian, karena regresi gabungan (dengan semua interaksi koefisien-dummy) cocok dengan koefisien yang sama, ia memiliki residu yang sama, di mana kesalahan standarnya dapat dihitung sebagais1 s2
Jumlah parameter sama dengan 6 dalam contoh: lima kemiringan dan intersep dalam setiap regresi.p 6
Biarkan mengestimasi parameter dalam satu regresi, b 2 mengestimasi parameter yang sama dalam regresi lainnya, dan b memperkirakan perbedaan mereka dalam regresi gabungan. Kemudian kesalahan standar mereka dihubungkan olehb1 b2 b
Jika Anda belum melakukan regresi gabungan, tetapi hanya memiliki statistik untuk regresi terpisah, masukkan persamaan sebelumnya untuk . Ini akan menjadi penyebut untuk uji-t. Jelas itu tidak sama dengan penyebut yang disajikan dalam pertanyaan.s
Asumsi yang dibuat oleh regresi gabungan adalah bahwa varian residual pada dasarnya sama di kedua regresi terpisah. Namun, jika ini bukan masalahnya, z-test tidak akan baik, (kecuali jika ukuran sampelnya besar): Anda ingin menggunakan tes CABF atau uji - Welch-Satterthwaite.
sumber
Cara paling langsung untuk menguji perbedaan dalam koefisien antara dua kelompok adalah dengan memasukkan istilah interaksi ke dalam regresi Anda, yang hampir seperti yang Anda jelaskan dalam pertanyaan Anda. Model yang akan Anda jalankan adalah sebagai berikut:
Perhatikan bahwa saya telah memasukkan variabel grup sebagai regressor terpisah dalam model. Dengan model ini, uji- dengan hipotesis nol H 0 : δ = 0 adalah tes koefisien yang sama antara kedua kelompok. Untuk melihat ini, pertama mari g i = 0 pada model di atas. Kemudian, kita mendapatkan persamaan berikut untuk grup 0:t H0:δ=0 gi=0
Sekarang, jika , maka kita memiliki:gi=1
Jadi, ketika adalah 0, maka dua kelompok memiliki koefisien yang sama.δ
sumber