Apa cara yang benar untuk menguji perbedaan yang signifikan antara koefisien?

18

Saya berharap seseorang dapat membantu meluruskan titik kebingungan bagi saya. Katakanlah saya ingin menguji apakah 2 set koefisien regresi secara signifikan berbeda satu sama lain, dengan pengaturan berikut:

  • yi=α+βxi+ϵi , dengan 5 variabel independen.
  • 2 grup, dengan ukuran yang kira-kira sama (meskipun ini mungkin bervariasi)n1,n2
  • Ribuan regresi serupa akan dilakukan secara bersamaan, sehingga beberapa jenis koreksi hipotesis harus dilakukan.

Salah satu pendekatan yang disarankan kepada saya adalah menggunakan tes-Z:

Z=b1b2(SEb12+SEb22)

Lain yang saya lihat disarankan di papan ini adalah untuk memperkenalkan variabel dummy untuk pengelompokan dan menulis ulang model sebagai:

yi=α+βxi+δ(xigi)+ϵi , di mana adalah variabel pengelompokan, dikodekan sebagai 0, 1.g

Pertanyaan saya adalah, bagaimana kedua pendekatan ini berbeda (mis. Asumsi yang berbeda dibuat, fleksibilitas)? Apakah yang satu lebih pantas daripada yang lain? Saya menduga ini cukup mendasar, tetapi klarifikasi apa pun akan sangat dihargai.

cashoes
sumber
Saya percaya jawaban dan komentar untuk pertanyaan serupa dapat memberikan beberapa klarifikasi yang Anda cari.
whuber
Terima kasih. Saya kenal dengan jawaban itu. Dari pembahasan di bawah ini jawaban yang diterima (dan komentar Anda di sana) Saya meninggalkan kesan bahwa membandingkan koefisien 2 cocok terpisah tidak tepat. Apakah uji-z diterapkan pada koefisien dari nilai cocok yang salah atau apakah pengkodean variabel dummy lebih mudah dan memberikan jawaban yang setara?
tunai
1
Silakan lihat paragraf terakhir dari balasan saya ("Batasan utama ..."). Uji-Z adalah valid dengan asumsi adalah besar (jika tidak digunakan pada tes) dan estimasi standar deviasi S E b i tidak terlalu berbeda satu sama lain. Tidak ada pendekatan yang terbaik ketika standar deviasi berbeda banyak (kira-kira, lebih dari rasio 3: 1). niSEbi
whuber

Jawaban:

13

Kedua pendekatan itu berbeda.

Biarkan estimasi kesalahan standar dari dua regresi menjadi dan s 2 . Kemudian, karena regresi gabungan (dengan semua interaksi koefisien-dummy) cocok dengan koefisien yang sama, ia memiliki residu yang sama, di mana kesalahan standarnya dapat dihitung sebagais1s2

s=(n1p)s12+(n2p)s22)n1+n22p.

Jumlah parameter sama dengan 6 dalam contoh: lima kemiringan dan intersep dalam setiap regresi.p6

Biarkan mengestimasi parameter dalam satu regresi, b 2 mengestimasi parameter yang sama dalam regresi lainnya, dan b memperkirakan perbedaan mereka dalam regresi gabungan. Kemudian kesalahan standar mereka dihubungkan olehb1b2b

SE(b)=s(SE(b1)/s1)2+(SE(b2)/s2)2.

Jika Anda belum melakukan regresi gabungan, tetapi hanya memiliki statistik untuk regresi terpisah, masukkan persamaan sebelumnya untuk . Ini akan menjadi penyebut untuk uji-t. Jelas itu tidak sama dengan penyebut yang disajikan dalam pertanyaan.s

Asumsi yang dibuat oleh regresi gabungan adalah bahwa varian residual pada dasarnya sama di kedua regresi terpisah. Namun, jika ini bukan masalahnya, z-test tidak akan baik, (kecuali jika ukuran sampelnya besar): Anda ingin menggunakan tes CABF atau uji - Welch-Satterthwaite.

whuber
sumber
9

Cara paling langsung untuk menguji perbedaan dalam koefisien antara dua kelompok adalah dengan memasukkan istilah interaksi ke dalam regresi Anda, yang hampir seperti yang Anda jelaskan dalam pertanyaan Anda. Model yang akan Anda jalankan adalah sebagai berikut:

yi=α+βxi+γgi+δ(xi×gi)+εi

Perhatikan bahwa saya telah memasukkan variabel grup sebagai regressor terpisah dalam model. Dengan model ini, uji- dengan hipotesis nol H 0 : δ = 0 adalah tes koefisien yang sama antara kedua kelompok. Untuk melihat ini, pertama mari g i = 0 pada model di atas. Kemudian, kita mendapatkan persamaan berikut untuk grup 0:tH0:δ=0gi=0

yi=α+βxi+εi

Sekarang, jika , maka kita memiliki:gi=1

yi=(α+γ)+(β+δ)xi+εi

Jadi, ketika adalah 0, maka dua kelompok memiliki koefisien yang sama.δ

Matt Blackwell
sumber
Terima kasih telah memperbaiki model (saya percaya versi saya di atas hanya memberlakukan bahwa intersep sama di kedua grup ...). Lebih tepatnya, apakah ini setara dengan z-test yang saya posting di atas?
tunai
yi=α+βxi+γgi+εiyi=α+βxi+γgi+δ(xi×gi)+εi
@ matt-blackwell apakah ini secara konseptual sama dengan stratifikasi model dengan setiap nilai g? (mis. b akan menjadi koefisien x ketika g = 0, dan beta + delta ketika g = 1) Meskipun saya menghargai bahwa stratifikasi tidak memungkinkan perbandingan statistik.
bobmcpop