Asumsikan Anda memiliki tahun alien dengan panjang yang tidak diketahui N. Jika Anda memiliki sampel acak alien tersebut dan beberapa dari mereka berbagi ulang tahun, dapatkah Anda menggunakan data ini untuk memperkirakan panjang tahun?
Misalnya, dalam sampel 100, Anda dapat memiliki dua kembar tiga (mis. Dua ulang tahun masing-masing dibagi oleh tiga alien) dan lima pasang dan delapan puluh empat lajang. Dalam memperkirakan N, minimum absolut adalah 91 dan maksimum tidak terikat, tetapi bagaimana saya akan menemukan nilai yang diharapkan masuk akal?
Asumsi termasuk hal-hal seperti "semua ulang tahun kemungkinan sama".
Tidak seperti pertanyaan lain yang dijawab di sini, ada tabrakan yang dikenal di ruangan itu. Setiap tahun yang cukup panjang akan memiliki kemungkinan kuat tidak ada tabrakan untuk ruang alien. Tetapi tahun-tahun yang sangat panjang akan memiliki peluang rendah dari setiap tabrakan, dan tahun-tahun pendek akan memiliki peluang rendah dari beberapa tabrakan, sehingga memberikan kisaran (teoretis) untuk panjang tahun yang paling mungkin.
sumber
Jawaban:
Nilai ekspektasi dari distribusi dihitung sebagai . Untuk masalah ini, kita ingin menghitung distribusi N diberikan beberapa kriteria tabrakan, atau menemukan E ( N ) = Σ ∞ n = 0 p n n diberikan beberapa kriteria tabrakan, di mana p n = P ( N = n ) .E(X)=∑pixi N E(N)=∑∞n=0pnn pn=P(N=n).
Misalkan Anda memiliki beberapa kriteria tumbukan seperti yang disebutkan di atas, dan biarkan menjadi probabilitas bahwa kriteria tumbukan terpenuhi mengingat panjang tahun adalah n . Kemudian q n dapat ditemukan dengan hanya membagi jumlah cara kriteria tabrakan dapat dipenuhi dengan jumlah cara ulang tahun dapat diatur secara umum. Setelah q n ditemukan untuk setiap kemungkinan n , maka satu-satunya bagian yang hilang adalah menerjemahkan q n ke p n .qn n. qn qn n qn pn.
Jika kita mengasumsikan bahwa sebanding dengan q n , maka p n = α q n . Karena ∑ ∞ n = 0 p n = 1 , α ∑ ∞ n = 0 q n = 1 dan α = 1pn qn pn=αqn. ∑∞n=0pn=1 α∑∞n=0qn=1 Karena itu, kita hanya perlu formula untukqnuntuk menyelesaikan masalah ini.α=1∑∞n=0qn. qn
Sebagai contoh Anda, pertama mari kita temukan sejumlah cara kriteria tabrakan dapat terjadi mengingat Singleton alien pertama dapat mendarat kapan saja, jadi ada n kemungkinan. Singleton berikutnya dapat mendarat pada hari apa saja kecuali hari ulang tahun alien pertama, jadi ada n - 1 kemungkinan. Melengkapi ini untuk 84 lajang pertama, kita mendapatkan n ( n - 1 ) ( n - 2 ) . . . ( n - 83 )N=n. n n−1 n(n−1)(n−2)...(n−83) kemungkinan cara ini bisa terjadi. Perhatikan bahwa kita juga memiliki 5 pasang dan 2 kembar tiga, sehingga alien "pertama" untuk setiap kelompok juga tidak boleh mendarat pada pasangan singleton. Ini mengarah ke cara alien ini tidak bertabrakan (sintaks kikuk adalah untuk generalisasi lebih mudah nanti).n(n−1)(n−2)...(n−84−5−2+1)
Berikutnya, alien kedua untuk pasangan atau triplet tertentu memiliki 91 pilihan, berikutnya memiliki 90, dll., Jumlah total cara ini dapat terjadi mengingat ulang tahun dari 91 alien pertama adalah . Anggota yang tersisa dari si kembar tiga harus jatuh pada hari ulang tahun pasangan, dan probabilitas yang terjadi adalah 7 ∗ 6 . Kami melipatgandakan probabilitas untuk semua ini bersama-sama untuk mendapatkan jumlah total cara yang mungkin untuk memenuhi kriteria tabrakan sebagai:91(91−1)(91−2)...(91−7+1) 7∗6
Pada titik ini pola yang jelas, jika kita memiliki lajang, b pasang, dan c kembar tiga, kita ganti 84 dengan sebuah , 5 dengan b , dan 2 dengan c untuk mendapatkan formula umum. Saya pikir juga jelas bahwa jumlah cara yang mungkin untuk ulang tahun yang akan diatur secara umum adalah n m , di mana m adalah jumlah total alien dalam masalah. Oleh karena itu, probabilitas memenuhi kriteria tumbukan adalah jumlah cara untuk memenuhi kriteria tumbukan dibagi dengan jumlah cara alien bisa dilahirkan, atau q n = r na b c a, b, c nm .qn=rnnm
Hal menarik lainnya muncul dalam rumus . Biarkan y n = n ( n - 1 ) . . . ( n - ( a + b + c ) + 1 ) = n !rn , dan biarkanznmenjadi bagian yang tersisa darirnsehinggarn=ynzn. Perhatikan bahwazntidak tergantung pada n, jadi kita cukup menuliszn=zsebagai konstanta! Sejakpn=qn/Σ ∞ i = 0 qi, danqn=yn=n(n−1)...(n−(a+b+c)+1)=n!(n−(a+b+c))! zn rn rn=ynzn zn zn=z pn=qn/∑∞i=0qi , kita bisa benar-benar faktorzdari jumlah penyebut. Pada titik ini, ia membatalkan dengan bagian dari pembilang untuk mendapatkanpn=ynqn=zynnm z . Kita dapat menyederhanakanynlebih jauh jika kita membiarkans=a+b+c(atau ini dapat dianggap sebagai jumlah ulang tahun unik dalam kelompok alien), sehingga kita mendapatkan:pn=ynnm/∑∞i=0(yiim) yn s=a+b+c
Sekarang kita memiliki rumus sederhana (cukup) untuk , dan oleh karena itu rumus sederhana (cukup) untuk E ( N ) , di mana satu-satunya asumsi yang dibuat adalah bahwa P ( N = n ) sebanding dengan q n (probabilitas pertemuan kriteria tabrakan diberikan bahwa N = n ). Saya pikir ini adalah asumsi yang adil untuk dibuat, dan seseorang yang lebih pintar dari saya bahkan mungkin dapat membuktikan bahwa asumsi ini dikaitkan dengan P ( N = n ) setelah distribusi multinomial. Pada titik ini kita dapat menghitung Epn E(N) P(N=n) qn N=n P(N=n) menggunakan metode numerik atau membuat beberapa asumsi aproksimasi, karena p n akan mendekati 0 ketika n mendekati ∞ .E(N) pn n ∞
sumber
Dalam jawaban ini saya ingin menuliskannya dengan lebih ringkas dan juga menyediakan cara untuk menghitung maksimum fungsi kemungkinan ini (daripada nilai yang diharapkan yang jauh lebih sulit untuk dihitung).
Fungsi kemungkinan untuk N
Estimasi kemungkinan maksimum untuk N
Catat itu
atau
sumber