Saya mengerti bahwa uji Wald untuk koefisien regresi didasarkan pada properti berikut yang berlaku secara asimptotik (mis. Wasserman (2006): Semua Statistik , halaman 153, 214-215): Di mana menunjukkan estimasi koefisien regresi, menunjukkan kesalahan standar dari koefisien regresi dan adalah nilai bunga ( biasanya 0 untuk menguji apakah koefisien tersebut adalah berbeda secara signifikan dari 0). Jadi ukuran Wald test adalah: tolak saatβ^se(β)β0β0αH0| W| >zα/2
Tetapi ketika Anda melakukan regresi linier dengan lm
dalam R, nilai- bukan nilai- digunakan untuk menguji apakah koefisien regresi berbeda secara signifikan dari 0 (dengan ). Selain itu, output dalam R terkadang memberikan - dan terkadang nilai sebagai statistik uji. Rupanya, -values digunakan ketika parameter dispersi diasumsikan diketahui dan -values digunakan ketika parameter dispersi diperkirakan (lihat tautan ini ).z z t z tsummary.lm
glm
Bisakah seseorang menjelaskan, mengapa distribusi- kadang-kadang digunakan untuk uji Wald meskipun rasio koefisien dan kesalahan standarnya diasumsikan didistribusikan sebagai standar normal?
Edit setelah pertanyaan dijawab
Posting ini juga memberikan informasi yang berguna untuk pertanyaan itu.
sumber
lm
glm
Jawaban:
Output dariz λ t
glm
menggunakan distribusi Poisson memberikan nilai- karena dengan distribusi Poisson, parameter rata-rata dan variansnya sama. Dalam model Poisson, Anda hanya perlu memperkirakan satu parameter ( λ ). Di tempat Anda harus memperkirakan parameter rata-rata dan dispersi, Anda harus melihat distribusi- t yang digunakan.glm
Untuk regresi linier standar, Anda menganggap istilah kesalahan didistribusikan secara normal. Di sini, parameter varians harus diperkirakan - maka penggunaan distribusi untuk statistik uji. Jika Anda entah bagaimana tahu varians populasi untuk istilah kesalahan, Anda bisa menggunakan statistik z -test.t z
Seperti yang Anda sebutkan di pos Anda, distribusi tes normal asimptotik. The -Distribusi adalah asimtotik normal, sehingga dalam sampel yang besar, perbedaan akan diabaikan.t
sumber
Dalam rangka GLM, secara umum, W uji statistik yang Anda sebutkan adalah asimtotik normal didistribusikan, itu sebabnya Anda lihat dalam R z nilai-nilai.
Selain itu, ketika berhadapan dengan model linear, yaitu GLM dengan variabel respon didistribusikan Normal, distribusi statistik uji adalah sebuah t Student , sehingga dalam R Anda memiliki t nilai-nilai.
sumber