Poisson adalah eksponensial karena Gamma-Poisson adalah untuk apa?

16

Distribusi Poisson dapat mengukur peristiwa per satuan waktu, dan parameternya adalah λ . Distribusi eksponensial mengukur waktu hingga peristiwa berikutnya, dengan parameter . Satu dapat mengkonversi satu distribusi ke yang lain, tergantung pada apakah lebih mudah untuk memodelkan peristiwa atau waktu.1λ

Sekarang, gamma-poisson adalah poisson "stretched" dengan varian yang lebih besar. Distribusi Weibull adalah eksponensial "membentang" dengan varian yang lebih besar. Tetapi dapatkah keduanya dengan mudah diubah menjadi satu sama lain, dengan cara yang sama Poisson dapat dikonversi menjadi eksponensial?

Atau adakah distribusi lain yang lebih tepat untuk digunakan dalam kombinasi dengan distribusi gamma-poisson?

Gamma-poisson juga dikenal sebagai distribusi binomial negatif, atau NBD.

zbicyclist
sumber

Jawaban:

14

Ini adalah masalah yang cukup lurus ke depan. Meskipun ada hubungan antara distribusi Poisson dan Negatif Binomial, saya benar-benar berpikir ini tidak membantu untuk pertanyaan spesifik Anda karena mendorong orang untuk memikirkan proses binomial negatif. Pada dasarnya, Anda memiliki serangkaian proses Poisson:

Yi(ti)|λiPoisson(λiti)

Di mana adalah proses dan t i adalah waktu Anda mengamatinya, dan saya menunjukkan individu. Dan Anda mengatakan bahwa proses ini "serupa" dengan mengikat tarif bersama dengan distribusi:Yitii

λiGamma(α,β)

Saat melakukan integrasi / mxixing lebih dari , Anda harus:λi

Yi(ti)|αβNegBin(α,pi)wherepi=titi+β

Ini memiliki PMF dari:

Pr(Yi(ti)=yi|αβ)=Γ(α+yi)Γ(α)yi!piyi(1pi)α

Untuk mendapatkan distribusi waktu tunggu, kami perhatikan bahwa:

= 1 - ( 1 - p i ) α = 1 - ( 1 +

Pr(Titi|αβ)=1Pr(Ti>ti|αβ)=1Pr(Yi(ti)=0|αβ)
=1(1pi)α=1(1+tiβ)α

Bedakan ini dan Anda memiliki PDF:

pTi(ti|αβ)=αβ(1+tiβ)(α+1)

Ini adalah anggota dari distribusi Pareto umum, tipe II. Saya akan menggunakan ini sebagai distribusi waktu tunggu Anda.

Untuk melihat koneksi dengan distribusi Poisson, perhatikan bahwa , sehingga jika kita aturβ=ααβ=E(λi|αβ) dan kemudian ambil batasα∞ yangkita dapatkan:β=αλα

limααβ(1+tiβ)(α+1)=limαλ(1+λtiα)(α+1)=λexp(λti)

Ini berarti Anda dapat menafsirkan sebagai parameter dispersi berlebih.1α

probabilityislogic
sumber
1
Anda juga dapat mencatat bahwa distribusi waktu tunggu adalah, secara kasar, distribusi eksponensial dengan parameter laju Gamma acak dan secara tegas ini adalah distribusi Beta jenis kedua, seperti untuk distribusi Gamma apa pun dengan parameter laju acak Gamma.
Stéphane Laurent
Menggunakan @probabilityislogic sebagai dasar, saya menemukan artikel berikut ini memberikan lebih banyak detail pada hubungan antara NBD dan Pareto: Gupta, Sunil dan Donald G. Morrison. Memperkirakan Heterogenitas dalam Tarif Pembelian Konsumen. Ilmu Pemasaran, 1991, 10 (3), 264-269. Terima kasih untuk semua yang membantu saya menjawab pertanyaan ini.
zbicyclist
1, saya kira bentuk analisis ini bagus mungkin tidak lagi ada untuk Poisson(λiti+c)c
1
Zi=Yi+XiYiXipoisson(c)XiλiYiZiPr(Yi=0)Pr(Xi=0)=ec1ec(1+tiβ)αecαβ(1+tiβ)(α+1)
1
λi<cti1c>0 pada jawaban saya sebelumnya). Ini berarti tidak ada distribusi nb.
probabilityislogic
4

Satu kemungkinan: Poisson adalah Eksponensial sebagai Negatif-Binomial adalah ... Eksponensial!

Ada proses Lévy peningkatan lompatan murni yang disebut Proses Binomial Negatift1

Mungkin ada deskripsi berguna lainnya. Lihat "Membingkai distribusi binomial negatif untuk sekuensing DNA."


Biarkan saya menjadi lebih eksplisit tentang bagaimana Proses Binomial Negatif yang dijelaskan di atas dapat dibangun.

  • p<1

  • X1,X2,X3,...P(xi=k)=1log(1p)pkk.

  • Nlog(1p)N(t)=Pois(tlog(1p)).

  • Let NBP be the process so that

NBP(t)=i=1N(t)Xi.

NBP is a pure jump process with logarithmically distributed jumps. The gaps between jumps follow an exponential distribution with rate log(1p).

I don't think it is obvious from this description that NBP(t) has a negative binomial NB(t,p) distribution, but there is a short proof using probability generating functions on Wikipedia, and Fisher also proved this when he introduced the logarithmic distribution to analyze the relative frequencies of species.

Douglas Zare
sumber
1
Tidak, setiap proses Poisson majemuk memiliki waktu tunggu eksponensial. Ini berarti Anda menambahkanPois(λt) Variabel acak IID dengan beberapa distribusi.
Douglas Zare
Tidak, bukan itu yang dimaksud dengan proses Poisson majemuk. en.wikipedia.org/wiki/Compound_Poisson_process "Lompatan tiba secara acak sesuai dengan proses Poisson dan ukuran lompatan juga acak, dengan distribusi probabilitas yang ditentukan." Saya tidak mengatakan variabel IID Poisson. Anda ambilNjumlah parsial dari variabel acak logaritmik IID dimana N adalah nilai dari proses Poisson.
Douglas Zare
Jika Anda mengalikan proses Poisson dengan 2, ini bukan proses Poisson dan waktu tunggu tetap eksponensial.
Douglas Zare
mari kita lanjutkan diskusi ini dalam obrolan
Douglas Zare
0

Saya belum bisa berkomentar, jadi saya minta maaf karena ini bukan solusi yang pasti.

Anda meminta distribusi yang sesuai untuk digunakan dengan NB tetapi tepat tidak sepenuhnya ditentukan. Jika distribusi yang tepat berarti tepat untuk menjelaskan data dan Anda mulai dengan Poisson yang overdispersi maka Anda mungkin harus melihat lebih jauh ke dalam penyebab overdispersi. NB tidak membedakan antara Poisson dengan cara heterogen atau ketergantungan kejadian positif (bahwa satu peristiwa yang terjadi meningkatkan kemungkinan terjadinya yang lain). Dalam waktu terus menerus ada juga ketergantungan durasi, misalnya ketergantungan durasi positif berarti berlalunya waktu meningkatkan probabilitas suatu kejadian. Itu juga menunjukkan bahwa ketergantungan durasi negatif asimtotik menyebabkan overdispersed Poisson [1] . Ini menambah daftar model waktu tunggu yang sesuai.

Meadowlark Bradsher
sumber
1
penyebab overdispersi: Ini adalah data pembelian konsumen. Konsumen individu poisson, masing-masing dengan tingkat pembelian lambda. Tetapi tidak setiap konsumen memiliki lambda yang sama - itulah penyebab dari penyebaran berlebihan. Tarif pembelian lambda dianggap didistribusikan sebagai gamma. Ini adalah model yang umum (ditelusuri kembali ke ASC Ehrenberg), tetapi saya belum menemukan apa pun dalam tulisannya yang menjawab pertanyaan ini.
zbicyclist