Saya mencoba untuk menemukan distribusi probabilitas dari jumlah variabel acak yang tidak terdistribusi secara identik. Ini sebuah contoh:
John bekerja di pusat panggilan layanan pelanggan. Dia menerima panggilan dengan masalah dan mencoba menyelesaikannya. Yang tidak bisa dia pecahkan, dia meneruskannya ke atasannya. Mari kita asumsikan bahwa jumlah panggilan yang didapatnya dalam sehari mengikuti distribusi Poisson dengan mean . Kesulitan dari setiap masalah bervariasi dari hal-hal yang sangat sederhana (yang pasti dapat dia tangani) hingga pertanyaan yang sangat khusus yang tidak akan dia pecahkan. Asumsikan bahwa probabilitas dia akan dapat memecahkan masalah ke- i mengikuti distribusi Beta dengan parameter dan dan tidak tergantung dari masalah sebelumnya. Berapa distribusi jumlah panggilan yang dia selesaikan dalam sehari?p i α β
Secara lebih formal, saya punya:
i = 0 , 1 , 2 , . . . , N untuk
di mana , dan( X i | p i ) ~ B e r n o u l l i ( p i ) p i ~ B e t a ( α , β )
Perhatikan bahwa, untuk saat ini, saya senang mengasumsikan bahwa independen. Saya juga menerima bahwa parameter dan tidak saling mempengaruhi walaupun dalam contoh kehidupan nyata ini ketika besar, parameter dan sedemikian rupa sehingga distribusi Beta memiliki massa lebih banyak pada tingkat keberhasilan yang rendah . Tapi mari kita abaikan itu untuk saat ini. μ , α β μ α β p
Saya dapat menghitung tetapi hanya itu saja. Saya juga dapat mensimulasikan nilai untuk mendapatkan gambaran tentang bagaimana distribusi terlihat (sepertinya Poisson tapi saya tidak tahu apakah itu karena jumlah dan saya coba atau apakah itu digeneralisasikan, dan bagaimana hal itu dapat berubah untuk nilai parameter yang berbeda). Adakah gagasan tentang distribusi ini atau bagaimana saya bisa memperolehnya?Y μ , α β
Harap dicatat bahwa saya juga telah memposting pertanyaan ini di Forum TalkStats tetapi saya pikir itu mungkin mendapatkan lebih banyak perhatian di sini. Permintaan maaf untuk cross-postingan dan banyak terima kasih sebelumnya atas waktu Anda.
EDIT : Ternyata (lihat jawaban yang sangat membantu di bawah - dan terima kasih untuk itu!), Itu memang distribusi , sesuatu yang saya tebak berdasarkan intuisi dan beberapa simulasi, tetapi tidak dapat membuktikan. Apa yang sekarang saya temukan mengejutkan adalah bahwa distribusi Poisson hanya bergantung pada rata-rata distribusi tetapi tidak terpengaruh oleh variansnya.Beta
Sebagai contoh, dua distribusi Beta berikut memiliki rerata yang sama tetapi berbeda. Untuk kejelasan, pdf biru mewakili dan yang merah .B e t a ( 0,75 , 0,75 )
Namun, keduanya akan menghasilkan distribusi yang sama yang, bagi saya, tampak agak kontra-intuitif. (Tidak mengatakan bahwa hasilnya salah, hanya mengejutkan!)
sumber
Jawaban:
Panggilan (yaitu, ) tiba sesuai dengan proses Poisson. Jumlah total panggilan mengikuti distribusi Poisson. Bagilah panggilan menjadi dua jenis, misalnya apakah atau . Tujuannya adalah untuk menentukan proses yang menghasilkan s. Ini sepele jika dengan probabilitas tetap : dengan prinsip superposisi proses Poisson, proses penuh yang ditipiskan menjadi hanya juga akan menjadi proses Poisson, dengan laju . Sebenarnya ini masalahnya, kami hanya memerlukan langkah tambahan untuk sampai ke sana. N X i = 1 X i = 0 1 X i = 1 p 1 p μXi N Xi=1 Xi=0 1 Xi=1 p 1 pμ
Marginalkan ke , sehinggapi
Contoh numerik (dengan R) ... pada gambar, garis vertikal berasal dari simulasi dan titik merah adalah PMF yang diturunkan di atas:
sumber
Karena adalah variabel acak dengan Anda memiliki dan ini sebenarnya merupakan probabilitas bahwa John benar-benar menyelesaikan masalah , terlepas dari semua yang lain.pi Beta(α,β) iE[pi]=αα+β i
Karena jumlah total masalah dalam sehari memiliki distribusi Poisson dengan parameter dan masing-masing akan diselesaikan dengan probabilitas , angka yang dipecahkan John setiap hari memiliki distribusi Poisson dengan parameterαμ μααα+β μαα+β
Perhitungan Anda tentang probabilitas dia tidak menyelesaikan masalah harusP(Y=0)=e−μα/(α+β)
sumber