Berapa distribusi probabilitas jumlah acak variabel Bernoulli non-iid ini?

9

Saya mencoba untuk menemukan distribusi probabilitas dari jumlah variabel acak yang tidak terdistribusi secara identik. Ini sebuah contoh:

John bekerja di pusat panggilan layanan pelanggan. Dia menerima panggilan dengan masalah dan mencoba menyelesaikannya. Yang tidak bisa dia pecahkan, dia meneruskannya ke atasannya. Mari kita asumsikan bahwa jumlah panggilan yang didapatnya dalam sehari mengikuti distribusi Poisson dengan mean . Kesulitan dari setiap masalah bervariasi dari hal-hal yang sangat sederhana (yang pasti dapat dia tangani) hingga pertanyaan yang sangat khusus yang tidak akan dia pecahkan. Asumsikan bahwa probabilitas dia akan dapat memecahkan masalah ke- i mengikuti distribusi Beta dengan parameter dan dan tidak tergantung dari masalah sebelumnya. Berapa distribusi jumlah panggilan yang dia selesaikan dalam sehari?p i α βμpiαβ

Secara lebih formal, saya punya:

i = 0 , 1 , 2 , . . . , NY=I(N>0)i=0NXi untuki=0,1,2,...,N

di mana , dan( X i | p i ) ~ B e r n o u l l i ( p i ) p i ~ B e t a ( α , β )NPoisson(μ)(Xi|pi)Bernoulli(pi)piBeta(α,β)

Perhatikan bahwa, untuk saat ini, saya senang mengasumsikan bahwa independen. Saya juga menerima bahwa parameter dan tidak saling mempengaruhi walaupun dalam contoh kehidupan nyata ini ketika besar, parameter dan sedemikian rupa sehingga distribusi Beta memiliki massa lebih banyak pada tingkat keberhasilan yang rendah . Tapi mari kita abaikan itu untuk saat ini. μ , α β μ α β pXiμ,αβμαβp

Saya dapat menghitung tetapi hanya itu saja. Saya juga dapat mensimulasikan nilai untuk mendapatkan gambaran tentang bagaimana distribusi terlihat (sepertinya Poisson tapi saya tidak tahu apakah itu karena jumlah dan saya coba atau apakah itu digeneralisasikan, dan bagaimana hal itu dapat berubah untuk nilai parameter yang berbeda). Adakah gagasan tentang distribusi ini atau bagaimana saya bisa memperolehnya?Y μ , α βP(Y=0)Yμ,αβ

Harap dicatat bahwa saya juga telah memposting pertanyaan ini di Forum TalkStats tetapi saya pikir itu mungkin mendapatkan lebih banyak perhatian di sini. Permintaan maaf untuk cross-postingan dan banyak terima kasih sebelumnya atas waktu Anda.

EDIT : Ternyata (lihat jawaban yang sangat membantu di bawah - dan terima kasih untuk itu!), Itu memang distribusi , sesuatu yang saya tebak berdasarkan intuisi dan beberapa simulasi, tetapi tidak dapat membuktikan. Apa yang sekarang saya temukan mengejutkan adalah bahwa distribusi Poisson hanya bergantung pada rata-rata distribusi tetapi tidak terpengaruh oleh variansnya.BetaPoisson(μαα+β)Beta

Sebagai contoh, dua distribusi Beta berikut memiliki rerata yang sama tetapi berbeda. Untuk kejelasan, pdf biru mewakili dan yang merah .B e t a ( 0,75 , 0,75 )Beta(2,2)Beta(0.75,0.75)

Distribusi Beta

Namun, keduanya akan menghasilkan distribusi yang sama yang, bagi saya, tampak agak kontra-intuitif. (Tidak mengatakan bahwa hasilnya salah, hanya mengejutkan!)Poisson(0.5μ)

Konstantinos
sumber
Untuk fix ada distribusi Poisson-binomial tetapi masalah Anda lebih rumit dari ini. N
Tim
Terima kasih, saya tahu distribusi Poisson-binomial tetapi acak di sini. N
Constantinos
Anda mungkin melihat senyawa Poisson , tetapi Anda mungkin perlu melakukan beberapa pekerjaan dengan 0s untuk membuatnya berguna
Glen_b -Reinstate Monica

Jawaban:

6

Panggilan (yaitu, ) tiba sesuai dengan proses Poisson. Jumlah total panggilan mengikuti distribusi Poisson. Bagilah panggilan menjadi dua jenis, misalnya apakah atau . Tujuannya adalah untuk menentukan proses yang menghasilkan s. Ini sepele jika dengan probabilitas tetap : dengan prinsip superposisi proses Poisson, proses penuh yang ditipiskan menjadi hanya juga akan menjadi proses Poisson, dengan laju . Sebenarnya ini masalahnya, kami hanya memerlukan langkah tambahan untuk sampai ke sana. N X i = 1 X i = 0 1 X i = 1 p 1 p μXiNXi=1Xi=01Xi=1p1pμ

Marginalkan ke , sehingga pi

Pr(Xi|α,β)=01piXi(1pi)1Xipiα1(1pi)β1B(α,β)dpi=B(Xi+α,1Xi+β)B(α,β)

B(a,b)=Γ(a)Γ(b)Γ(a+b)Γ(x+1)=xΓ(x)

Pr(Xi=1|α,β)=Γ(1+α)Γ(β)Γ(1+α+β)Γ(α+β)Γ(α)Γ(β)=αα+β
XiBernoulli(αα+β)Yαμα+β

Contoh numerik (dengan R) ... pada gambar, garis vertikal berasal dari simulasi dan titik merah adalah PMF yang diturunkan di atas:

draw <- function(alpha, beta, mu) 
{ N <- rpois(1, mu); p = rbeta(N, alpha, beta); sum(rbinom(N, size=1, prob=p)) }

pmf <- function(y, alpha, beta, mu)
  dpois(y, alpha*mu/(alpha+beta))

y <- replicate(30000,draw(4,5,10))
tb <- table(y)

# simulated pmf
plot(tb/sum(tb), type="h", xlab="Y", ylab="Probability")
# analytic pmf
points(0:max(y), pmf(0:max(y), 4, 5, 10), col="red")

masukkan deskripsi gambar di sini

Nate Pope
sumber
3
  1. Karena adalah variabel acak dengan Anda memiliki dan ini sebenarnya merupakan probabilitas bahwa John benar-benar menyelesaikan masalah , terlepas dari semua yang lain.piBeta(α,β) iE[pi]=αα+βi

  2. Karena jumlah total masalah dalam sehari memiliki distribusi Poisson dengan parameter dan masing-masing akan diselesaikan dengan probabilitas , angka yang dipecahkan John setiap hari memiliki distribusi Poisson dengan parameterαμ μααα+βμαα+β

  3. Perhitungan Anda tentang probabilitas dia tidak menyelesaikan masalah harusP(Y=0)=eμα/(α+β)

Henry
sumber