Interpretasi output .L & .Q dari GLM binomial negatif dengan data kategorikal

14

Saya baru saja menjalankan GLM binomial negatif dan ini adalah output:

Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat, 
    init.theta = 1.080668549, link = log)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.2452  -0.9973  -0.3028   0.3864   1.8727  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   1.6954     0.1152  14.720  < 2e-16 ***
method.L     -0.6828     0.1637  -4.171 3.04e-05 ***
site.L        0.9952     0.2050   4.854 1.21e-06 ***
site.Q       -0.4634     0.1941  -2.387    0.017 *  
depth.L       0.8951     0.1988   4.502 6.74e-06 ***
depth.Q       0.2060     0.1984   1.038    0.299    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)

    Null deviance: 185.1  on 89  degrees of freedom
Residual deviance: 100.8  on 84  degrees of freedom
AIC: 518.24

Prediktor saya semuanya kategoris. Apakah ini sebabnya saya mendapatkan .Ldan .Q. Saya kira mereka mewakili kategori yang berbeda tetapi apakah ada yang tahu kode yang bisa saya gunakan untuk memberi label sebelum menjalankan GLM sehingga mereka muncul sebagai kategori yang berbeda?

Vivienne
sumber
Saya menemukan kode yang cukup membingungkan apakah ada kode yang lebih sederhana? Kategori sangat sederhana: metode 1 dan metode 2, situs 1, situs2 dan situs 3 dan kedalaman adalah 5, 10 dan 15
Vivienne
ats.ucla.edu/stat/r/library/contrast_coding.htm#SIMPLE - atau ats.ucla.edu/stat/r/library/contrast_coding.htm#dummy , yang merupakan standar untuk faktor yang tidak dipesan di glm.
Scortchi

Jawaban:

13

Variabel Anda tidak hanya dikodekan sebagai faktor (untuk membuatnya kategorikal), mereka dikodekan sebagai faktor yang dipesan . Kemudian, secara default, R cocok dengan serangkaian fungsi polinomial ke level variabel. Yang pertama adalah linear ( .L), yang kedua adalah kuadrat ( .Q), yang ketiga (jika Anda memiliki cukup level) akan kubik, dll. R akan cocok dengan satu fungsi polinomial yang lebih sedikit daripada jumlah level dalam variabel Anda. Misalnya, jika Anda hanya memiliki dua level, hanya tren linier yang cocok. Selain itu, basis polinomial yang digunakan adalah ortogonal. (Untuk apa nilainya, tidak ada yang khusus untuk R — atau model binomial negatif — semua perangkat lunak dan jenis model regresi akan melakukan hal yang sama.)


Berfokus secara khusus pada R, jika Anda ingin variabel Anda dikodekan sebagai dipesan atau tidak, Anda akan menggunakan ? Faktor :

my.variable <- factor(my.variable, ordered=TRUE)   # an ordered factor
my.variable <- factor(my.variable, ordered=FALSE)  # an unordered factor
gung - Pasang kembali Monica
sumber
Oh saya telah memesannya sekarang labelnya sudah menyala, terima kasih banyak gung!
Vivienne