Apa itu theta dalam regresi binomial negatif yang dilengkapi dengan R?

26

Saya punya pertanyaan tentang regresi binomial negatif: Misalkan Anda memiliki perintah berikut:

require(MASS)
attach(cars)
mod.NB<-glm.nb(dist~speed)
summary(mod.NB)
detach(cars)

(Perhatikan bahwa mobil adalah set data yang tersedia dalam R, dan saya tidak terlalu peduli jika model ini masuk akal.)

Yang ingin saya ketahui adalah: Bagaimana saya bisa menafsirkan variabel theta(seperti yang dikembalikan di bagian bawah panggilan ke summary). Apakah ini parameter bentuk dari distribusi negbin dan apakah mungkin untuk menafsirkannya sebagai ukuran kemiringan?

MarkDollar
sumber
Ringkasan dari apa yang dikatakan MASS ada di sini .
Scortchi

Jawaban:

17

Ya, thetaadalah parameter bentuk dari distribusi binomial negatif, dan tidak, Anda tidak dapat benar-benar mengartikannya sebagai ukuran kemiringan. Lebih tepatnya:

  • kemiringan akan tergantung pada nilai theta, tetapi juga pada rata-rata
  • tidak ada nilai thetayang akan menjamin Anda kurang condong

Jika saya tidak mengacaukannya, dalam mu/ thetaparametrization yang digunakan dalam regresi binomial negatif, kemiringannya adalah

Skew(NB)=θ+2μθμ(θ+μ)=1+2μθμ(1+μθ)

Dalam konteks ini, biasanya diinterpretasikan sebagai ukuran penyebaran berlebihan sehubungan dengan distribusi Poisson. Varian dari binomial negatif adalah μ + μ 2 / θ , jadi θ benar-benar mengontrol variabilitas berlebih dibandingkan dengan Poisson (yang akan menjadi μ ), dan bukan condong.θμ+μ2/θθμ

Aniko
sumber
terima kasih sejauh ini! Ini bantuan yang bagus ... Tetapi: Bagaimana saya bisa mengartikan nilai theta yang tinggi atau rendah? Dalam buku McCaullaughs model umum linier ada link ke makalah ini dari anscombe untuk membuat interpretasi k. Tapi sayangnya saya tidak begitu mengerti. Makalah ini claremontmckenna.edu/facultysites/math/FacMember/MOneill/…
MarkDollar
Anda hanya perlu membaca halaman pertama. Jadi theta (atau k dalam anscombe) adalah parameter bentuk dari distribusi negbin dan dikelola, jika distribusinya lebih dekat ke gamma (k -> 0) atau poisson (k -> infinity). Tapi apa artinya cocok? Bagaimana saya bisa menginterpretasikan theta misalnya untuk estimasi mobil?
MarkDollar
33

Saya dirujuk ke situs ini oleh salah satu siswa saya dalam kursus Data Hitungan Pemodelan saya . Tampaknya ada banyak informasi yang salah tentang model binomial negatif, dan terutama sehubungan dengan statistik dispersi dan parameter dispersi.

μglmglm.nb θ

glm.nbglmμ+μ2θμ+αμ2glm.nbglmglm.nbrupanya mengambil hubungan tidak langsung dari McCullagh & Nelder, tetapi Nelder (yang merupakan co-founder GLM pada tahun 1972) menulis add-on sistem kk untuk Genstat pada tahun 1993 di mana ia berpendapat bahwa hubungan langsung lebih disukai. Dia dan istrinya biasa mengunjungi saya dan keluarga saya setiap dua tahun sekali di Arizona mulai awal tahun 1993 hingga tahun sebelum dia meninggal. Kami membahas ini dengan cukup teliti, karena saya telah menempatkan hubungan langsung ke dalam program glm yang saya tulis pada akhir 1992 untuk perangkat lunak Stata dan Xplore, dan untuk makro SAS pada tahun 1994.

nbinomialαθnbinomial

Joseph Hilbe
sumber
2
ϕcov(β^)=ϕ(XTŴ^X)1θμθ"bentuk" -yang terakhir yang menurut saya tidak masuk akal karena pasti memengaruhi bentuk.
Momo
Berapa kisaran theta? Apakah theta harus bernilai lebih dari satu?
News_is_Selection_Bias
2

referensi glm binomial negatif: masukkan deskripsi gambar di sini

Wikipedia negatif binomial 'r' adalah 'theta' glm yang menyiratkan glm 'theta' adalah parameter bentuk. Secara sederhana, 'theta' glm adalah sejumlah kegagalan.

datageek
sumber