Saya memiliki satu set data yang saya harapkan untuk mengikuti distribusi Poisson, tetapi overdispersikan sekitar 3 kali lipat. Saat ini, saya memodelkan penyebaran berlebih ini menggunakan sesuatu seperti kode berikut dalam R.
## assuming a median value of 1500
med = 1500
rawdist = rpois(1000000,med)
oDdist = rawDist + ((rawDist-med)*3)
Secara visual, ini tampaknya sesuai dengan data empiris saya dengan sangat baik. Jika saya senang dengan fit, apakah ada alasan bahwa saya harus melakukan sesuatu yang lebih kompleks, seperti menggunakan distribusi binomial negatif, seperti yang dijelaskan di sini ? (Jika demikian, petunjuk atau tautan apa pun untuk melakukannya akan lebih dihargai).
Oh, dan saya sadar bahwa ini menciptakan distribusi yang sedikit bergerigi (karena penggandaan oleh tiga), tetapi itu seharusnya tidak masalah untuk aplikasi saya.
Pembaruan: Demi siapa pun yang mencari dan menemukan pertanyaan ini, inilah fungsi R sederhana untuk memodelkan poisson overdispersed menggunakan distribusi binomial negatif. Atur d ke rasio mean / varians yang diinginkan:
rpois.od<-function (n, lambda,d=1) {
if (d==1)
rpois(n, lambda)
else
rnbinom(n, size=(lambda/(d-1)), mu=lambda)
}
(melalui milis R: https://stat.ethz.ch/pipermail/r-help/2002-June/022425.html )
sumber
Jika nilai rata-rata Anda untuk Poisson adalah 1500, maka Anda sangat dekat dengan distribusi normal; Anda dapat mencoba menggunakannya sebagai perkiraan dan kemudian memodelkan mean dan varians secara terpisah.
sumber