dispersi dalam ringkasan.glm ()

13

Saya melakukan glm.nb oleh

glm1<-glm.nb(x~factor(group))

dengan kelompok menjadi kategororial dan x menjadi variabel metrik. Ketika saya mencoba untuk mendapatkan ringkasan hasil, saya mendapatkan hasil yang sedikit berbeda, tergantung pada apakah saya menggunakan summary()atau summary.glm. summary(glm1)memberi saya

    ...
Coefficients:
                    Estimate Std. Error z value Pr(>|z|)  
    (Intercept)       0.1044     0.1519   0.687   0.4921  
    factor(gruppe)2   0.1580     0.2117   0.746   0.4555  
    factor(gruppe)3   0.3531     0.2085   1.693   0.0904 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 1)

sedangkan summary.glm (glm1) memberi saya

    ...
Coefficients:
                    Estimate Std. Error t value Pr(>|t|)  
    (Intercept)       0.1044     0.1481   0.705   0.4817  
    factor(gruppe)2   0.1580     0.2065   0.765   0.4447  
    factor(gruppe)3   0.3531     0.2033   1.737   0.0835 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)

Saya mengerti arti dari parameter dispersi, tetapi tidak pada baris

(Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067).

Dalam buku pegangan dikatakan, itu akan menjadi estimasi dispersi, tetapi tampaknya menjadi estimasi yang buruk, karena 0,95 tidak dekat dengan 0,7109, atau apakah dispersi yang diperkirakan itu berbeda dari parameter dispersi yang diestimasi? Saya kira, saya harus mengatur dispersi summary.nb(x, dispersion=)ke sesuatu, tapi saya tidak yakin, apakah saya harus mengatur dispersi ke 1 (yang akan menghasilkan hasil yang sama dengan summary()atau jika saya harus memasukkan perkiraan parameter dispersi, dalam hal ini mengarah ke summary.nb(glm1, dispersion=0.7109)atau sesuatu yang lain? Atau apakah saya baik-baik saja dengan hanya menggunakan summary(glm1)?

Renoir Pulitz
sumber
2
Gunakan ringkasan () saat dikirim ke metode S3 yang sesuai untuk negbin kelas. Penyebaran tentu saja harus 1, yang diperkirakan adalah theta, yang lebih baik disebut parameter bentuk untuk menghindari kebingungan. Lihat juga stats.stackexchange.com/questions/27773/how-does-glm-nb-work/…
Momo

Jawaban:

13

summary.glm"negbin"summary.glmdispersionsummary.glm glmϕϕfamilyglm.nb"Negative Binomial(theta)"summary.glmpada model yang dipasangi oleh glm.nb, kode in

if (is.null(dispersion)) 
    dispersion <- if (object$family$family %in% c("poisson", 
        "binomial")) 
        1
    else if (df.r > 0) {
        est.disp <- TRUE
        if (any(object$weights == 0)) 
                warning("observations with zero weight not used for calculating dispersion")
            sum((object$weights * object$residuals^2)[object$weights > 
            0])/df.r
    }

"poisson""binomial"ϕsummary.negbin

ϕdispersion

Kedua, Anda salah mengerti output. Ketika kamu melihat

Negative Binomial(0.7109)

θ^ϕ

ϕϕ=1summary.negbin

summary(glm1, dispersion = 0.9509)

negbinϕ

Pasang kembali Monica - G. Simpson
sumber
5
+1 Penjelasan yang bagus. Saya punya dua komentar kecil: Parameter dispersi dalam binomial, Poisson, dan negatif binomial dengan parameter bentuk yang diketahui adalah 1 menurut definisi keluarga eksponensial (bukan asumsi). Ketika Anda mengatakan bahwa dispersi yang berbeda dapat diperkirakan dan dipasok ke metode ringkasan maka seseorang harus berhati-hati karena seseorang akan menjelajah ke dalam wilayah kuasi yang memiliki implikasi terutama untuk kemungkinannya.
Momo
@Momo Well berkata. Saya terpecah antara apa yang Anda sebutkan dan detail halaman bantuan untuk fungsi masing-masing.
Pasang kembali Monica - G. Simpson
2

θ1θ11θEYEμEμ

f(y)=Γ(θ+y)Γ(θ)y!μyθθ(μ+θ)θ+y

harapan

EY=μ

& varians

VarY=μ+μ2θ

Seperti @Momo tunjukkan, parameter dispersi adalah hal yang sama sekali berbeda, yang Anda biarkan berbeda untuk melakukan estimasi kuasi-kemungkinan. Untuk model binomial negatif & model Poisson (benar), model ini benar-benar ditetapkan pada nilai satu.

Scortchi - Reinstate Monica
sumber