Berapa kali saya harus menggulingkan dadu untuk secara yakin menilai keadilannya?

22

(Permintaan maaf sebelumnya untuk penggunaan bahasa awam daripada bahasa statistik.)

Jika saya ingin mengukur peluang menggelindingkan masing-masing sisi dari die enam sisi fisik tertentu ke sekitar +/- 2% dengan keyakinan yang wajar akan kepastian, berapa banyak gulungan sampel yang dibutuhkan?

yaitu Berapa kali saya harus melempar dadu, menghitung setiap hasil, untuk menjadi 98% yakin bahwa peluangnya menggulung masing-masing pihak dalam 14,6% - 18,7%? (Atau beberapa kriteria serupa di mana seseorang akan menjadi sekitar 98% yakin bahwa mati itu adil hingga dalam 2%.)

(Ini adalah masalah dunia nyata untuk permainan simulasi menggunakan dadu dan ingin memastikan desain dadu tertentu cukup dekat dengan peluang 1/6 untuk menggulirkan setiap angka. Ada klaim bahwa banyak desain dadu umum telah diukur bergulir 29% 1 oleh menggulirkan beberapa dadu tersebut masing-masing 1.000 kali

Dronz
sumber
1
Ini jauh lebih sulit daripada menemukan interval kepercayaan untuk binomial, karena Anda ingin menjaga semua probabilitas tetap di periksa. Lihatlah makalah Hsiuying Wang tentang interval kepercayaan simultan untuk distribusi multinomial ( Jurnal Analisis Multivariat 2008, 99, 5, 896-911). Anda dapat menemukan beberapa kode di posting blog ini , yang juga memberikan ringkasan singkat tentang beberapa pekerjaan yang telah dilakukan pada ini.
idnavid
1
Perhatikan bahwa jika Anda hanya tertarik untuk memeriksa apakah 1 telah diputar cukup lama, ini menyederhanakan banyak pertanyaan.
Dennis Jaheruddin
2
Penting untuk dicatat bahwa "interval kepercayaan" tidak memberi Anda "kemungkinan persentil untuk menjadi benar". Saya menduga bahwa Anda menggunakan penggunaan umum yang sangat masuk akal dari istilah "98% yakin", tetapi Anda harus tahu kapan saja seseorang menyebutkan "interval kepercayaan" yang sama sekali tidak sama dengan kemungkinan 98%: link.springer.com/ artikel / 10.3758% 2Fs13423-013-0572-3
BrianH
1
@BrianH Terima kasih! Saya tidak hanya bermaksud ungkapan sehari-hari, tetapi saya mencari untuk mengukur kepastian yang tersirat oleh tes. Tampaknya bagi saya bahwa dengan cara yang sama masuk akal untuk mengatakan saya berharap untuk menggulung beberapa hasil cetakan persentase yang dapat dihitung dari waktu, bahwa akan ada perhitungan yang serupa (tetapi lebih kompleks) untuk seberapa besar kemungkinan saya menggulung hasil dalam margin kesalahan tertentu dalam I roll n kali, itulah yang saya pikir saya mengerti jawaban Xiamoi (dan komentar tindak lanjut) katakan. Iya nih?
Dronz
1
@Dronz Agar adil, ini adalah salah satu hal yang menurut Anda akan lebih mudah daripada yang sebenarnya terjadi. Sebenarnya sangat rumit. Berikut adalah beberapa pertanyaan kunci terkait di tempat lain untuk membantu memberi Anda gagasan tentang bagaimana tidak ada jawaban yang sangat mudah: Frequentist math.stackexchange.com/questions/1578932/… Bayesian math.stackexchange.com/questions/1584833/… dan kesenangan: rpg.stackexchange.com/questions/70802/…
BrianH

Jawaban:

18

TL; DR: jika p = 1/6 dan Anda ingin tahu seberapa besar n perlu 98% yakin dadu itu adil (hingga dalam 2%), n harus setidaknya n ≥ 766 .


Biarkan n menjadi jumlah gulungan dan X jumlah gulungan yang mendarat di sisi tertentu. Kemudian X mengikuti distribusi Binomial (n, p) di mana p adalah probabilitas untuk mendapatkan sisi yang ditentukan.

Dengan teorema limit pusat, kita tahu itu

n(X/np)N(0,p(1p))

Karena X/n adalah mean sampel dari n Bernoulli (p) variabel acak. Oleh karena itu untuk n besar , interval kepercayaan untuk p dapat dikonstruksikan sebagai

Xn±Zp(1p)n

Karena p tidak diketahui, kita bisa menggantinya dengan rata-rata sampel p = X / n , dan oleh berbagai teorema konvergensi, kita tahu selang kepercayaan yang dihasilkan akan asimtotik berlaku. Jadi kami mendapatkan interval kepercayaan formulirp^=X/n

p^±Zp^(1p^)n

dengan p = X / n . Saya akan menganggap Anda tahu apa Z -nilai. Misalnya, jika Anda menginginkan interval kepercayaan 95%, Anda mengambil Z = 1.96 . Jadi untuk tingkat kepercayaan tertentu α yang kita milikip^=X/nZZ=1.96α

p^±Zαp^(1p^)n

Sekarang katakanlah Anda ingin interval kepercayaan ini kurang dari Cα , dan ingin tahu seberapa besar sampel yang kita butuhkan untuk membuat case ini. Yah ini adalah equivelant untuk menanyakan apa nα memenuhi

Zαp^(1p^)nαCα2

Yang kemudian dipecahkan untuk mendapatkan

nα(2ZαCα)2p^(1p^)

ZαCαp^nαpn

Xiaomi
sumber
3
Terima kasih. Karena saya belum pernah melakukan matematika tipe perguruan tinggi dalam beberapa dekade, dapatkah saya menyulitkan Anda untuk memasukkan angka-angka dan benar-benar memberi saya angka kasar berapa kali saya harus melempar dadu, sebagai bilangan bulat?
Dronz
9
hal=1/6nnn766Cα
4
Mungkin lebih menarik untuk melihat distribusi multinomial, karena sekarang kami menguji masing-masing pihak secara terpisah. Ini tidak memperhitungkan semua informasi yang kami miliki tentang masalah tersebut. Untuk penjelasan lihat intiuitive di stat.berkeley.edu/~stark/SticiGui/Text/chiSquare.htm
Jan
5
Saya setuju dengan @Jan: Jawaban ini tidak menjawab pertanyaan. Selain itu, tidak dapat dengan mudah diadaptasi untuk membangun jawaban dengan menerapkannya secara terpisah untuk semua enam wajah, karena enam tes saling tergantung.
Whuber
3
Ini jawaban yang bagus, tapi saya sepenuhnya setuju dengan @Jan, wah. Pertanyaan ini layak mendapat jawaban berdasarkan statistik chi-square dan distribusi multinomial.
Łukasz Grad