Pertanyaan ini terinspirasi oleh jawaban Martijn di sini .
Misalkan kita cocok GLM untuk satu keluarga parameter seperti model binomial atau Poisson dan itu adalah prosedur kemungkinan penuh (sebagai lawan mengatakan, quasipoisson). Kemudian, varians adalah fungsi dari mean. Dengan binomial: dan dengan Poisson .var [ X ] = E [ X ]
Tidak seperti regresi linier ketika residu terdistribusi normal, distribusi sampel terbatas dan tepat dari koefisien-koefisien ini tidak diketahui, itu mungkin kombinasi yang rumit dari hasil dan kovariat. Juga, menggunakan estimasi rata - rata GLM , yang digunakan sebagai taksiran plugin untuk varian hasil.
Seperti halnya regresi linier, koefisien memiliki distribusi normal asimptotik, sehingga dalam inferensi sampel terbatas kita dapat memperkirakan distribusi sampelnya dengan kurva normal.
Pertanyaan saya adalah: apakah kita memperoleh sesuatu dengan menggunakan pendekatan distribusi-T ke distribusi sampling dari koefisien dalam sampel hingga? Di satu sisi, kita tahu variansnya tetapi kita tidak tahu distribusi yang tepat, jadi perkiraan T sepertinya pilihan yang salah ketika bootstrap atau penaksir jackknife dapat menjelaskan dengan tepat perbedaan-perbedaan ini. Di sisi lain, mungkin sedikit konservatisme dari distribusi-T hanya disukai dalam praktiknya.
Jawaban:
Jawaban singkat: Belum jawaban lengkap, tetapi Anda mungkin tertarik dengan distribusi berikut yang terkait dengan pertanyaan terkait: Ini membandingkan z-test (seperti juga digunakan oleh glm) dan t-test
Dan hanya ada perbedaan kecil. Dan juga z-test sebenarnya lebih baik (tapi ini mungkin karena kedua t-test dan z-test adalah "salah" dan mungkin kesalahan dari z-test mengkompensasi kesalahan ini).
Jawaban Panjang: ...
sumber