Saya baru saja menjalankan GLM binomial negatif dan ini adalah output:
Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat,
init.theta = 1.080668549, link = log)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.2452 -0.9973 -0.3028 0.3864 1.8727
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.6954 0.1152 14.720 < 2e-16 ***
method.L -0.6828 0.1637 -4.171 3.04e-05 ***
site.L 0.9952 0.2050 4.854 1.21e-06 ***
site.Q -0.4634 0.1941 -2.387 0.017 *
depth.L 0.8951 0.1988 4.502 6.74e-06 ***
depth.Q 0.2060 0.1984 1.038 0.299
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)
Null deviance: 185.1 on 89 degrees of freedom
Residual deviance: 100.8 on 84 degrees of freedom
AIC: 518.24
Prediktor saya semuanya kategoris. Apakah ini sebabnya saya mendapatkan .L
dan .Q
. Saya kira mereka mewakili kategori yang berbeda tetapi apakah ada yang tahu kode yang bisa saya gunakan untuk memberi label sebelum menjalankan GLM sehingga mereka muncul sebagai kategori yang berbeda?
glm
.Jawaban:
Variabel Anda tidak hanya dikodekan sebagai faktor (untuk membuatnya kategorikal), mereka dikodekan sebagai faktor yang dipesan . Kemudian, secara default, R cocok dengan serangkaian fungsi polinomial ke level variabel. Yang pertama adalah linear (
.L
), yang kedua adalah kuadrat (.Q
), yang ketiga (jika Anda memiliki cukup level) akan kubik, dll. R akan cocok dengan satu fungsi polinomial yang lebih sedikit daripada jumlah level dalam variabel Anda. Misalnya, jika Anda hanya memiliki dua level, hanya tren linier yang cocok. Selain itu, basis polinomial yang digunakan adalah ortogonal. (Untuk apa nilainya, tidak ada yang khusus untuk R — atau model binomial negatif — semua perangkat lunak dan jenis model regresi akan melakukan hal yang sama.)Berfokus secara khusus pada R, jika Anda ingin variabel Anda dikodekan sebagai dipesan atau tidak, Anda akan menggunakan ? Faktor :
sumber