Uji Wald dalam regresi (OLS dan GLM): t-vs z-distribusi

22

Saya mengerti bahwa uji Wald untuk koefisien regresi didasarkan pada properti berikut yang berlaku secara asimptotik (mis. Wasserman (2006): Semua Statistik , halaman 153, 214-215): Di mana menunjukkan estimasi koefisien regresi, menunjukkan kesalahan standar dari koefisien regresi dan adalah nilai bunga ( biasanya 0 untuk menguji apakah koefisien tersebut adalah berbeda secara signifikan dari 0). Jadi ukuran Wald test adalah: tolak saatβ^se(β)β0β0αH0| W| >zα/2

(β^β0)se^(β^)N(0,1)
β^se^(β^)β0β0αH0|W|>zα/2 mana
W=β^se^(β^).

Tetapi ketika Anda melakukan regresi linier dengan lmdalam R, nilai- bukan nilai- digunakan untuk menguji apakah koefisien regresi berbeda secara signifikan dari 0 (dengan ). Selain itu, output dalam R terkadang memberikan - dan terkadang nilai sebagai statistik uji. Rupanya, -values ​​digunakan ketika parameter dispersi diasumsikan diketahui dan -values ​​digunakan ketika parameter dispersi diperkirakan (lihat tautan ini ).z z t z ttzsummary.lmglmztzt

Bisakah seseorang menjelaskan, mengapa distribusi- kadang-kadang digunakan untuk uji Wald meskipun rasio koefisien dan kesalahan standarnya diasumsikan didistribusikan sebagai standar normal?t

Edit setelah pertanyaan dijawab

Posting ini juga memberikan informasi yang berguna untuk pertanyaan itu.

COOLSerdash
sumber
2
Apa yang membuat Anda berpikir bahwa statistik uji yang dilaporkan adalah tes Wald?
Glen_b -Reinstate Monica
3
Karena - atau nilai selalu koefisien dibagi dengan kesalahan standar dalam dan . tztlmglm
COOLSerdash

Jawaban:

20

Output dari glmmenggunakan distribusi Poisson memberikan nilai- karena dengan distribusi Poisson, parameter rata-rata dan variansnya sama. Dalam model Poisson, Anda hanya perlu memperkirakan satu parameter ( λ ). Di tempat Anda harus memperkirakan parameter rata-rata dan dispersi, Anda harus melihat distribusi- t yang digunakan.zλglmt

Untuk regresi linier standar, Anda menganggap istilah kesalahan didistribusikan secara normal. Di sini, parameter varians harus diperkirakan - maka penggunaan distribusi untuk statistik uji. Jika Anda entah bagaimana tahu varians populasi untuk istilah kesalahan, Anda bisa menggunakan statistik z -test.tz

Seperti yang Anda sebutkan di pos Anda, distribusi tes normal asimptotik. The -Distribusi adalah asimtotik normal, sehingga dalam sampel yang besar, perbedaan akan diabaikan.t

wcampbell
sumber
3

Dalam rangka GLM, secara umum, W uji statistik yang Anda sebutkan adalah asimtotik normal didistribusikan, itu sebabnya Anda lihat dalam R z nilai-nilai.

Selain itu, ketika berhadapan dengan model linear, yaitu GLM dengan variabel respon didistribusikan Normal, distribusi statistik uji adalah sebuah t Student , sehingga dalam R Anda memiliki t nilai-nilai.

EdoLu
sumber