Uji Wald dalam regresi (OLS dan GLM): t-vs z-distribusi

22

Saya mengerti bahwa uji Wald untuk koefisien regresi didasarkan pada properti berikut yang berlaku secara asimptotik (mis. Wasserman (2006): Semua Statistik , halaman 153, 214-215): Di mana menunjukkan estimasi koefisien regresi, menunjukkan kesalahan standar dari koefisien regresi dan adalah nilai bunga ( biasanya 0 untuk menguji apakah koefisien tersebut adalah berbeda secara signifikan dari 0). Jadi ukuran Wald test adalah: tolak saat

\frac{(\hat{β} - β_{0})}{\hat{se} (\hat{β})} \sim N (0, 1)

$\frac{(\hat{\beta}-\beta_{0})}{\widehat{\operatorname{se}}(\hat{\beta})}\sim \mathcal{N}(0,1)$

\hat{β}

$\hat{\beta}$

\hat{se} (\hat{β})

$\widehat{\operatorname{se}}(\hat{\beta})$

β_{0}

$\beta_{0}$

β_{0}

$\beta_{0}$

α

$\alpha$

H_{0}

$H_{0}$

| W | > z_{α / 2}

$|W|> z_{\alpha/2}$ mana

W = \frac{\hat{β}}{\hat{se} (\hat{β})} .

$W=\frac{\hat{\beta}}{\widehat{\operatorname{se}}(\hat{\beta})}.$

Tetapi ketika Anda melakukan regresi linier dengan lmdalam R, nilai- bukan nilai- digunakan untuk menguji apakah koefisien regresi berbeda secara signifikan dari 0 (dengan ). Selain itu, output dalam R terkadang memberikan - dan terkadang nilai sebagai statistik uji. Rupanya, -values digunakan ketika parameter dispersi diasumsikan diketahui dan -values digunakan ketika parameter dispersi diperkirakan (lihat tautan ini ). $t$ $z$ summary.lmglm $z$ $t$ $z$ $t$

Bisakah seseorang menjelaskan, mengapa distribusi- kadang-kadang digunakan untuk uji Wald meskipun rasio koefisien dan kesalahan standarnya diasumsikan didistribusikan sebagai standar normal? $t$

Edit setelah pertanyaan dijawab

Posting ini juga memberikan informasi yang berguna untuk pertanyaan itu.

r regression hypothesis-testing generalized-linear-model COOLSerdash
sumber

2

Apa yang membuat Anda berpikir bahwa statistik uji yang dilaporkan adalah tes Wald?

Glen_b -Reinstate Monica

3

Karena - atau nilai selalu koefisien dibagi dengan kesalahan standar dalam dan .

z

$z$

t

$t$ lmglm

COOLSerdash

20

Output dari glmmenggunakan distribusi Poisson memberikan nilai- karena dengan distribusi Poisson, parameter rata-rata dan variansnya sama. Dalam model Poisson, Anda hanya perlu memperkirakan satu parameter ( ). Di tempat Anda harus memperkirakan parameter rata-rata dan dispersi, Anda harus melihat distribusi- digunakan. $z$ $\lambda$ glm $t$

Untuk regresi linier standar, Anda menganggap istilah kesalahan didistribusikan secara normal. Di sini, parameter varians harus diperkirakan - maka penggunaan distribusi untuk statistik uji. Jika Anda entah bagaimana tahu varians populasi untuk istilah kesalahan, Anda bisa menggunakan statistik -test. $t$ $z$

Seperti yang Anda sebutkan di pos Anda, distribusi tes normal asimptotik. The -Distribusi adalah asimtotik normal, sehingga dalam sampel yang besar, perbedaan akan diabaikan. $t$

wcampbell
sumber

3

Dalam rangka GLM, secara umum, W uji statistik yang Anda sebutkan adalah asimtotik normal didistribusikan, itu sebabnya Anda lihat dalam R z nilai-nilai.

Selain itu, ketika berhadapan dengan model linear, yaitu GLM dengan variabel respon didistribusikan Normal, distribusi statistik uji adalah sebuah t Student , sehingga dalam R Anda memiliki t nilai-nilai.

EdoLu
sumber

Uji Wald dalam regresi (OLS dan GLM): t-vs z-distribusi

Jawaban: