Jumlah warna berbeda yang diharapkan saat menggambar tanpa penggantian

15

Pertimbangkan sebuah guci yang berisi N bola dari P warna yang berbeda, dengan pi menjadi proporsi bola warna i antara N bola ( ipi=1 ). Saya menggambar nN bola dari guci tanpa penggantian dan melihat jumlah γ warna yang berbeda di antara bola yang ditarik. Berapakah harapan γ sebagai fungsi n/N , tergantung pada sifat yang sesuai dari distribusi p ?

Untuk memberikan lebih banyak wawasan: jika N=P dan pi=1/P untuk semua i , maka saya akan selalu melihat persis n warna, yaitu, γ=P(n/N) . Jika tidak, dapat ditunjukkan bahwa ekspektasi γ adalah >P(n/N) . Untuk tetap Pdan N , akan terlihat bahwa faktor yang digunakan untuk mengalikan n/N akan maksimal ketika pseragam; mungkin jumlah warna berbeda yang diharapkan terlihat dibatasi sebagai fungsi dan, misalnya, entropi p ?n/Np

Ini tampaknya terkait dengan masalah pengumpul kupon, kecuali bahwa pengambilan sampel dilakukan tanpa penggantian, dan distribusi kupon tidak seragam.

a3nm
sumber
1
Saya pikir masalah ini dapat dinyatakan sebagai: berapa jumlah yang diharapkan dari entri bukan nol dalam sampel dari distribusi hypergeometrik multivariat ?
Kodiologist

Jawaban:

2

Misalkan Anda memiliki warna di mana k N . Mari b i menunjukkan jumlah warna bola saya jadi Σ b i = N . Mari B = { b 1 , ... , b k } dan membiarkan E i ( B ) notate set yang terdiri dari i himpunan bagian unsur B . Misalkan Q n , c menunjukkan jumlah cara yang dapat kita pilih nkkNbiibi=NB={b1,,bk}Ei(B)iBQn,cnelemen dari himpunan di atas sedemikian sehingga jumlah warna yang berbeda dalam himpunan yang dipilih adalah . Untuk c = 1 rumusnya sederhana:cc=1

Qn,1=EE1(B)(eEen)

Untuk kita dapat menghitung set bola ukuran n yang memiliki paling banyak 2 warna dikurangi jumlah set yang memiliki tepat 1 warna:c=2n1

Qn,2=EE2(B)(eEen)(k11)Qn,1

adalah jumlah cara Anda dapat menambahkan warna ke warna tetap sehingga Anda akan memiliki 2 warna jika Anda memilikitotal warnak. Rumus generik adalah jika Anda memilikic1warna tetap dan Anda ingin membuatc2warna darinya sambil memilikitotal warnak(c1c2k) adalah ( k-c1(k11)kc1c2kc1c2k. Sekarang kita memiliki segalanya untuk memperoleh rumus umum untukQn,c:(kc1c2c1)Qn,c

Qn,c=EEc(B)(eEen)i=1c1(kici)Qn,i

Probabilitas bahwa Anda akan memiliki warna persis jika Anda menggambar n bola adalah:cn

Pn,c=Qn,c/(Nn)

Perhatikan juga bahwa jikay>x.(xy)=0y>x

Mungkin ada kasus-kasus khusus di mana formula dapat disederhanakan. Saya tidak repot-repot menemukan penyederhanaan kali ini.

Nilai yang diharapkan Anda mencari jumlah warna tergantung pada adalah sebagai berikut:n

γn=i=1kPn,ii
jakab922
sumber
4
Anda memanggil probabilitas, tetapi Anda tampaknya telah mendefinisikannya sebagai jumlah bilangan bulat. Apakah Anda lupa membagi sesuatu? Pn,c
Kodiologist
Ya, saya kira Anda benar. Anda perlu membagi dengan , tapi sayangnya masih tidak benar seperti itu. JikaE,FEc(B)danEFSaya melakukan penggandaan ganda dalam rumus di atas. (Nn)E,FEc(B)EF
jakab922
Seems like the formula can be fixed by using the sieve method. I will post a fix later today.
jakab922