Jumlah koefisien distribusi multinomial

10

Saya melemparkan dadu yang adil. Setiap kali saya mendapat 1, 2, atau 3, saya menuliskan '1'; setiap kali saya mendapatkan 4 saya menuliskan '2'; setiap kali saya mendapatkan angka 5 atau 6, saya menuliskan angka '3.'

Biarkan menjadi jumlah total lemparan yang saya butuhkan untuk produk dari semua angka yang saya tulis menjadi . Saya ingin menghitung (atau perkiraan) , dan perkiraan dapat diberikan sebagai fungsi dari distribusi Normal.N100000P(N25)

Pertama, saya tahu bahwa karena . Sekarang, biarkan , , dan menjadi berapa kali saya menuliskan masing-masing 1, 2, dan 3. Kemudian:P(N11)=1log3100.00010.48abc

P(a,b,cn)={(na,b,c)(12)a(16)b(13)c if a+b+c=n0 otherwise

Yang ingin saya hitung adalah:

P(a+b+c252b3c100000)

Bagaimana saya menghitung ini?

--EDIT:

Jadi disarankan agar saya dapat mengganti kondisinya dengan:

P(a+b+c25αa+βb+γcδ)

di mana , , , dan .α=0β=log2γ=log3δ=log100000

Ini memang terlihat lebih bisa dipecahkan! Sayangnya saya masih belum tahu bagaimana menyelesaikannya.

Pedro Carvalho
sumber
2
+1 Masalah ini mungkin terlihat sedikit lebih akrab, dan meminjamkan dirinya lebih jelas untuk memperkirakan solusi, jika Anda menulis kondisi dalam bentuk mana dan . αa+βb+γcδα=0,β=log(2),γ=log(3),δ=log(100000)
whuber
Saya menambahkan cara baru untuk menulis kondisi ini, tetapi sayangnya saya masih tidak memiliki petunjuk yang samar tentang cara mengatasi ini!
Pedro Carvalho
Petunjuk lain adalah bahwa jika ada kejadian '2' maka Anda akan berhenti. Jadi Anda bisa memperkirakan ini dengan binomial negatif dengan parameter dan (juga dengan dan ). Jawaban yang tepat juga dapat dikelola karena tidak ada banyak kombinasi. Juga, kondisinya tidak akurat - Anda harus memasukkan bahwa '2' atau '3' direkam pada roll ke-17170.5111/3N
probabilityislogic

Jawaban:

1

Pertanyaan ini adalah kasus khusus di mana Anda berurusan dengan kuantitas yang merupakan fungsi linear dari variabel acak multinomial. Dimungkinkan untuk memecahkan masalah Anda dengan tepat, dengan menyebutkan kombinasi multinomial yang memenuhi ketimpangan yang disyaratkan, dan menjumlahkan distribusi pada rentang itu. Dalam kasus di mana besar ini mungkin menjadi tidak layak secara komputasi. Dalam hal ini dimungkinkan untuk mendapatkan distribusi perkiraan menggunakan perkiraan normal ke multinomial. Versi umum dari perkiraan ini ditunjukkan di bawah, dan kemudian ini diterapkan pada contoh spesifik Anda.N


Masalah perkiraan umum: Misalkan kita memiliki urutan variabel acak yang dapat dipertukarkan dengan kisaran . Untuk setiap kita dapat membentuk vektor penghitung , yang menghitung jumlah kemunculan setiap hasil di nilai pertama dari urutan. Karena urutan yang mendasarinya dapat ditukar, vektor hitungan didistribusikan sebagai:1,2,...,mnNXX(n)(X1,X2,...,Xm)n

X ~ Mu(n,θ)θ=limnX(n)/n.

Sekarang, misalkan kita memiliki beberapa vektor bobot non-negatif dan kami menggunakan bobot ini untuk mendefinisikan fungsi linear:w=(w1,w2,...,wm)

A(n)i=1mwiXi.

Karena bobotnya tidak negatif, kuantitas baru ini tidak menurun dalam . Kami kemudian mendefinisikan angka , yang merupakan jumlah pengamatan terkecil yang diperlukan untuk mendapatkan nilai minimum yang ditentukan untuk fungsi linear kami. Kami ingin memperkirakan distribusi dalam kasus di mana nilai ini (secara stokastik) besar.nN(a)min{nN|A(n)a}N(a)


Memecahkan masalah perkiraan umum: Pertama, kami mencatat bahwa karena adalah non-penurunan (yang berlaku karena kami mengasumsikan bahwa semua bobot adalah non-negatif), kami memiliki:A(n)n

P(N(a)n)=P(N(a)>n1)=P(A(n1)<a).

Oleh karena itu, distribusi secara langsung berkaitan dengan distribusi . Dengan asumsi bahwa kuantitas sebelumnya adalah besar, kita dapat memperkirakan distribusi yang terakhir dengan mengganti vektor acak diskrit dengan perkiraan kontinyu dari distribusi normal multivariat. Ini mengarah pada perkiraan normal untuk kuantitatif linear , dan kita dapat menghitung momen-momen dari kuantitas ini secara langsung. Untuk melakukan ini, kita menggunakan fakta bahwa , dan untuk . Dengan beberapa aljabar dasar, ini memberi kita:NAXA(n)E(Xi)=nθiV(Xi)=nθi(1θi)C(Xi,Xj)=nθiθjij

μE(1nA(n))=i=1mwiθi,

σ2V(1nA(n))=i=1mwiθi(i=1mwiθi)2=μ(1μ).

Mengambil perkiraan normal ke multinomial sekarang memberi kita perkiraan distribusi . Menerapkan hasil perkiraan ini:A(n) ~ N(nμ,nμ(1μ))

P(N(a)n)=P(A(n1)<a)Φ(a(n1)μ(n1)μ(1μ)).

(Simbol adalah notasi standar untuk fungsi distribusi normal standar.) Dimungkinkan untuk menerapkan perkiraan ini untuk menemukan probabilitas yang berkaitan dengan kuantitas untuk nilai tertentu dari . Ini adalah perkiraan dasar yang belum berusaha untuk memasukkan koreksi kontinuitas pada nilai-nilai nilai hitungan multinomial yang mendasarinya. Ini diperoleh dengan mengambil pendekatan normal menggunakan dua momen sentral pertama yang sama sebagai fungsi linier yang tepat.ΦN(a)a


Aplikasi untuk masalah Anda: Dalam masalah Anda, Anda memiliki probabilitas , bobot , dan nilai cut-off . Karenanya, Anda memiliki (pembulatan ke enam titik desimal) . Menerapkan pendekatan di atas yang kita miliki (pembulatan ke enam angka desimal):θ=(12,16,13)w=(0,ln2,ln3)a=ln100000μ=16ln2+13ln3=0.481729

P(N(a)25)Φ(ln100000240.481729240.499666)=Φ(0.019838)=0.492086.

Dengan penerapan distribusi multinomial yang tepat, menjumlahkan semua kombinasi yang memenuhi persyaratan , dapat ditunjukkan bahwa hasil yang tepat adalah . Oleh karena itu, kita dapat melihat bahwa perkiraannya cukup dekat dengan jawaban yang tepat dalam kasus ini.P(A(24)<a)P(N(a)25)=0.483500

Semoga jawaban ini memberi Anda jawaban untuk pertanyaan spesifik Anda, sementara juga menempatkannya dalam kerangka kerja yang lebih umum dari hasil probabilistik yang berlaku untuk fungsi linier vektor acak multinomial. Metode saat ini harus memungkinkan Anda untuk mendapatkan solusi perkiraan untuk masalah dari tipe umum yang Anda hadapi, memungkinkan untuk variasi dalam angka-angka tertentu dalam contoh Anda.

Ben - Pasang kembali Monica
sumber
0

Mari kita lakukan perkiraan normal.

Pertama, mari kita ulangi sepenuhnya masalah Anda dalam log. Anda mulai dari 0 pada waktu t = 0. Kemudian, pada setiap langkah waktu, Anda menambahkan:

  • 0 dengan probabilitas 1/2

  • log(2) dengan probabilitas 1/6

  • log(3) dengan probabilitas 1/3

Anda menghentikan proses ini ketika jumlah Anda melebihi pada titik mana Anda melihat berapa banyak lemparan yang Anda buat. Jumlah lemparan yang Anda perlukan untuk mencapai titik itu adalah ^log(105)N

Kalkulator saya memberi tahu saya bahwa rata-rata kenaikan Anda adalah: dan variansnya . Untuk referensi, titik akhir adalah sehingga kami akan mencapainya dalam sekitar 24 langkah0.480.2511.51

Bersyarat pada kenyataan bahwa kami telah melakukan 25 langkah, distribusi jumlah kira-kira Gaussian berpusat di 12.0 dan dengan varian 6.25. Ini memberi kita perkiraan Gaussian kasarp(N25)0.5

Anda harus melihat kumulans dari jumlah pada N = 25 untuk mengetahui apakah pendekatan Gaussian benar atau tidak. Mengingat bahwa kenaikannya tidak simetris, kira-kira mungkin bukan yang terbaik

Guillaume Dehaene
sumber
1
Bisakah Anda menyelesaikan derivasi untuk saya? Saya mengalami kesulitan melihatnya. Juga, apakah tidak ada cara pasti untuk menghitungnya?
Pedro Carvalho
1
Bukankah maksud Anda "log (2)" dan "log (3)" di mana Anda memiliki log (1) dan log (2)?
Glen_b -Reinstate Monica
@GuillaumeDehaene menulis: .... Dengan perhitungan saya, dalam dua cara yang berbeda, yang sangat berbeda dengan 0,5p(N25)0.5P(N25)=1P(N24)=1112729185663307164998372267786240.8266
serigala
bagaimana Anda mendapatkan P (n \ leq24) \ kira-kira 0,18?
Guillaume Dehaene