Kemungkinan 10.000: 1 kemungkinan terjadi tepat sekali dalam 10.000 percobaan

8

Saya tertarik untuk memahami perbedaan antara "kemungkinan" dari suatu peristiwa acak dengan probabilitas tertentu yang benar-benar terjadi dengan probabilitas tepat yang dikatakan kemungkinan. yaitu jika suatu peristiwa memiliki probabilitas 1 banding 10.000, apa kemungkinannya dalam 10.000 uji coba itu akan terjadi tepat 1 kali, bukan 2 kali, bukan 0 kali, bukan 3 kali, dll. dan bagaimana seseorang mengungkapkan (dan menjelaskan) deviasinya?

Jika suatu peristiwa memiliki probabilitas 1: 10.000, maka dalam 100.000 uji coba kemungkinan akan terjadi 10 kali; dalam 1.000.000 uji coba, kemungkinan akan terjadi 100 kali, tetapi bukankah itu juga akan terjadi dalam set 1.000.000 uji coba berapa kali, misalnya: 98 kali, 99 kali, 101 kali, 96 kali, 102 kali, dll.

Secara statistik, berapa banyak uji coba yang harus dirata-ratakan dan diperhitungkan untuk mendekati kepastian statistik bahwa hasil tertentu sebenarnya 1: 10.000, dan bukan 1: 9999 atau 1: 10001 atau 1: 1000.5, dll?

RobH
sumber
1) Apa yang Anda maksud dengan "kepastian statistik"? 2) "Kemungkinan" memiliki arti teknis khusus dalam statistik yang saya ragu Anda maksudkan. Jika yang Anda maksud probabilitas , gunakan kata itu sebagai gantinya.
Glen_b -Reinstate Monica
Tepat .... Saya tidak yakin tentang arti teknis yang tepat dari dua istilah "kemungkinan" dan "probabilitas" ... apa yang saya maksudkan, saya kira, adalah probabilitas 1: 10.000 (atau apa pun probabilitasnya) tetapi jika saya secara acak menggambar sesuatu yang memiliki probabilitas itu, itu tidak berarti bahwa itu akan menjadi kenyataan tepat 1 dari setiap 10.000 kali, bukan? Dan sejauh "kepastian statistik" ... berapa banyak percobaan yang Anda perlukan untuk menentukan probabilitas aktual dari sesuatu jika data empiris menunjukkan bahwa sesuatu yang dianggap 1: 10.000 sebenarnya 1: 9999 atau 1: 10001, dll.
RobH
Terima kasih atas balasan Anda .. Saya kira apa yang saya pikirkan adalah, apakah ukuran sampel yang lebih besar, yaitu 10.000.000 percobaan, 100.000.000 percobaan, dll., Menghasilkan hasil yang lebih dekat dengan hasil yang diharapkan dari 1 per 10.000, atau akan selalu ada kemungkinan penyimpangan serupa ....
RobH
Ya, itu mendekati 1 dalam 10.000 lebih dan lebih dekat; Karena jumlah uji coba meningkat (saya akan berasumsi jauh melampaui 10.000 dan meningkat), proporsi sampel menjadi lebih terkonsentrasi di sekitar proporsi (populasi) yang benar. Deviasi standar dari distribusi proporsi sampel ( kesalahan standarnya ) menurun secara proporsional ke1n. Bahkan untuk ukuran besarn (Sekali lagi, secara substansial lebih dari 10.000) Anda akan memiliki sekitar 95% dari probabilitas di dalamnya p±1n
Glen_b -Reinstate Monica
Terima kasih atas jawabannya .... sekarang dengan risiko mengulang titik ini, izinkan saya bertanya tindak lanjut ... katakanlah setelah 10.000.000.000 percobaan hasilnya terjadi 999.982 kali, apakah Anda kemudian menyatakan probabilitas untuk percobaan berikutnya menjadi 1: 9999.82 atau 1: 10000 atau hasil perhitungan yang melibatkan penyimpangan? .. (Atau saya kira hal yang sama dapat ditanyakan setelah hanya 1 set 10.000 uji coba dengan akurasi jauh lebih sedikit!)
RobH

Jawaban:

16

1 di 10000 probabilitas, apa kemungkinan probabilitas bahwa dalam 10000 uji coba itu akan terjadi tepat 1 kali

1/e0.3679, sedekat tidak membuat peluang. (Probabilitas yang terjadi tepat 0 kali hampir persis sama.)

Sunting: Seperti yang ditunjukkan Mark L Stone dengan tepat, saya menganggap pertanyaan Anda menyiratkan bahwa persidangan independen tanpa membuktikan bahwa itulah masalahnya. Ini adalah asumsi kritis (dan mungkin tidak masuk akal dalam banyak situasi). Meskipun demikian saya akan terus menjawab atas dasar itu, karena saya terus berpikir bahwa itu adalah niat Anda.

Hal yang sama berlaku untuk n uji coba dan probabilitas 1/n, untuk yang cukup besar n.

Probabilitas (untuk semua yang besar n) terlihat seperti ini (menunjukkan kasing untuk n= 10000):

masukkan deskripsi gambar di sini

Jika suatu peristiwa memiliki probabilitas 1: 10.000, maka dalam 100.000 uji coba kemungkinan akan terjadi 10 kali; dalam 1.000.000 uji coba, kemungkinan akan terjadi 100 kali, tetapi bukankah itu juga akan terjadi dalam set 1.000.000 uji coba berapa kali, misalnya: 98 kali, 99 kali, 101 kali, 96 kali, 102 kali, dll.

Tidak cukup: 99 dan 100 memiliki peluang yang sama, tetapi yang lainnya memiliki peluang lebih rendah:

masukkan deskripsi gambar di sini

(probabilitas terus turun saat Anda bergerak lebih jauh).

Secara khusus, Anda sedang berhadapan dengan distribusi binomial dengann=1000000 dan p=1/10000.

Sejak n besar dan pkecil, baik didekati dengan distribusi Poisson dengan meanλ=np=100.

berapa banyak uji coba yang harus dirata-ratakan dan dipertanggungjawabkan untuk mendekati kepastian statistik bahwa hasil tertentu sebenarnya 1: 10.000, dan bukan 1: 9999 atau 1: 10001

Anda tidak dapat memastikan itu sebenarnya 1/10000, karena Anda dapat mendekatinya secara sewenang-wenang tetapi berbeda dari itu.

Di n percobaan, jumlah keberhasilan yang diharapkan adalah np dengan sd np(1p)np.

Jika p=1/10000, dan n=1012, maka jumlah keberhasilan yang diharapkan adalah 108 dengan sd 104; jikap=1/9999 perkiraan jumlah keberhasilan yang diharapkan 100,010,000... tentang satu standar deviasi - tidak cukup untuk membedakan mereka "andal". Tetapi dengann=4×1012, kamu tentang 2sd pergi, dan Anda dapat membedakan mereka lebih mudah itu mungkin sekitar serendah yang diinginkan kebanyakan orang. Din=1013 Anda dapat membedakan mereka dengan cukup baik (kemungkinan 1/10000 terlihat seperti 1/9999 atau 1/10001 atau apa pun yang lebih jauh secara kebetulan sangat kecil pada saat itu).

Katakanlah Anda senang 1013 uji coba untuk membedakan p=1/10000 dari 1/9999. Jika Anda ingin mengesampingkan 1/9999.5 dengan keyakinan yang sama dengan yang Anda miliki untuk mengesampingkan 1/9999, Anda akan membutuhkan 4 kali lebih banyak percobaan.

Anda dapat melihat bahwa menjabarkan proporsi ke banyak angka akurasi (kapan psangat kecil) membutuhkan banyak percobaan; Anda memerlukan ukuran sampel beberapa kali lebih banyak dari(1/p)3 untuk mendapatkan perkiraan yang cukup akurat sehingga Anda dapat mengesampingkan p=1/(k±1) kapan itu benar-benar 1/k.

katakanlah setelah 10.000.000.000 percobaan hasilnya terjadi 999.982 kali, apakah Anda kemudian menyatakan probabilitas untuk percobaan berikutnya menjadi 1: 9999.82 atau 1: 10000 atau beberapa hasil yang dihitung yang melibatkan penyimpangan? .. (Atau saya kira hal yang sama dapat ditanyakan setelah hanya 1 set 10.000 uji coba dengan akurasi jauh lebih sedikit!)

Ya, bisa ditanyakan pada 10.000 uji coba atau 1000 atau 100.

Mari sederhanakan hal-hal dan ambil 10.000 percobaan dan 98 kesuksesan. Seseorang tentu saja dapat mengambil sebagai titik perkiraan probabilitas keberhasilan 98/10000 = 0,0098 tetapi ini tidak akan benar-benar menjadi proporsi yang mendasarinya, hanya perkiraan itu. Mungkin 0,944 ... atau 0,997 ... atau sejumlah nilai lainnya.

Jadi satu hal yang dilakukan orang adalah membangun interval nilai yang (dalam beberapa hal) cukup konsisten dengan proporsi yang diamati. Ada dua filosofi utama statistik (statistik Bayesian dan frequentist) yang dalam sampel besar biasanya cenderung menghasilkan interval yang sama tetapi yang memiliki interpretasi yang agak berbeda.

Yang paling umum adalah interval kepercayaan (sering) ; interval untuk parameter (p) yang akan (lebih dari pengulangan dari percobaan yang sama) diharapkan termasuk parameter proporsi waktu tertentu.

Interval Bayesian yang khas akan dimulai dengan distribusi sebelumnya pada parameter yang mewakili ketidakpastian Anda tentang nilainya, dan menggunakan data untuk memperbarui pengetahuan itu ke distribusi posterior dan dari sana memperoleh interval yang kredibel .

Interval kepercayaan sangat banyak digunakan (meskipun interval yang kredibel mungkin mendekati harapan Anda tentang apa yang harus dilakukan interval). Dalam kasus interval kepercayaan proporsi binomial , seperti di sini, ada berbagai pendekatan, meskipun dalam sampel besar mereka semua memberi Anda interval yang hampir sama.

dengan dadu genap 6 x 10 ^ 9 percobaan mungkin tidak menghasilkan tepat 1 x 10 ^ 9 untuk masing-masing dari enam hasil

Benar; Anda akan mengharapkan (dengan dadu yang adil) untuk mendapatkan antara 999,94 juta dan 1000,06 juta kesuksesan hampir (tetapi tidak cukup) setiap kali Anda mencobanya.

Jika probabilitas aktual adalah 1: 10.000, maka peningkatan percobaan dalam penyimpangan yang diharapkan akan cenderung untuk mengkonfirmasi itu

Itu akan hampir selalu terus konsisten dengan itu (dan dengan berbagai nilai terdekat lainnya). Apa yang terjadi bukanlah Anda dapat mengatakannya 1/10000, tetapi bahwa interval nilai probabilitas yang konsisten dengan hasil Anda akan semakin sempit saat ukuran sampel bertambah.

Glen_b -Reinstate Monica
sumber
Glen_b, Anda menganggap setiap percobaan independen. Itu mungkin yang dimaksudkan OP, tetapi kurangnya kecanggihan dalam probabilitas OP menyarankan kepada saya bahwa OP secara implisit membuat asumsi independensi, seperti yang mungkin selalu berlaku untuk probabilitas. Pertimbangkan variabel acak yang akan ada 10.000 percobaan, sehingga dengan probabilitas 9999/10000 peristiwa tersebut terjadi pada nol percobaan dan dengan probabilitas 1/10000 peristiwa tersebut terjadi pada semua 10.000 percobaan. Acara ini memiliki probabilitas 1 banding 10.000, dan probabilitas itu terjadi tepat sekali dalam 100.000 percobaan adalah nol.
Mark L. Stone
Terima kasih @ MarkL.Stone - Anda benar, saya menganggap pertanyaan itu menyiratkan independensi tetapi saya seharusnya sepenuhnya eksplisit tentang hal itu. Saya akan menambahkan kalimat untuk mengklarifikasi jawaban saya.
Glen_b -Reinstate Monica
Saya akan mengasumsikan perbedaan dalam apakah setiap percobaan independen seperti: jika saya memiliki wadah 10.000 kelereng, 1 merah dan 9.999 hitam, kemungkinan memilih marmer merah pada percobaan pertama adalah 1: 10.000 ... jika Saya menggambar marmer hitam, maka probabilitas merah pada percobaan berikutnya akan menjadi 1: 9999, dan terus sampai saya menggambar marmer merah, setelah itu probabilitasnya adalah 0. Contoh percobaan independen akan berarti bahwa setiap marmer akan diambil dari wadah baru 9999 kelereng hitam dan 1 marmer merah, benar? Ya, itulah yang ingin saya jelaskan.
RobH
2

Saya datang ke pertanyaan ini berdasarkan judulnya, sambil berharap untuk menemukan kemungkinan acara dengan p=1nterjadi setidaknya sekali dalamniterasi. Aku tahu pertanyaan Anda adalah tentang persis sekali tapi saya kira itu entah bagaimana terkait.

Sepertinya untuk n cukup besar, kemungkinan ini cenderung 1/e0.632 dan (sangat mengejutkan) hampir tidak tergantung n.

Penjelasan:

Misalkan saya melempar dadu 6 kali. Peluang untuk mendapatkan 1setidaknya satu dari 6 percobaan tersebut adalah:

Kemungkinan tidak mendapatkan '1' untuk setiap percobaan:

p=56

Kemungkinan tidak mendapatkan '1' dalam 6 percobaan:

p=566

Kemungkinan mendapatkan '1' setidaknya sekali dalam 6 percobaan:

p=15660.665

Demikian pula, anggap suatu peristiwa memiliki probabilitas 1/10000. Peluang kejadian ini terjadi setidaknya sekali 10000percobaan adalah:

p=1999910000100000.634

Kami dapat memperkirakan ini untuk apa saja ndan mendapatkan:

Kemungkinan acara dengan p=1n terjadi setidaknya sekali n mencoba:

p=1(n1n)n

Dan sejak:

limn+n1nn=limn+(11n)n=1e0.368

Kita dapat mengatakan bahwa:

limn+1n1nn0.632

Merencanakan persamaan ini dalam Grapher , kita mendapatkan sesuatu seperti ini:

masukkan deskripsi gambar di sini

Kesimpulan: walaupun itu masuk akal, saya sebenarnya cukup terkejut dengan fakta bahwa ada kemungkinan suatu kejadian p=1n terjadi setidaknya sekali keluar n mencoba hampir independen n, untuk n sekecil 3 sudah.

Jivan
sumber
0

Biarkan membangun masalah sederhana pada dadu. Mari kita menghitung probabilitas kemungkinan bahwa pada 6 lemparan dadu, skor akan menjadi 1 tepat satu kali.

Berapa banyak cara ini bisa terjadi [dan probabilitas masing-masing]:

1 is scored in first throw but not in any other throws[1/6*5/6*5/6*...] [=3125/46656]
1 is scored in second throw but not in any other throw [5/6*1/6*5/6*...] [=3125/46656]
...
...

jadi total probabilitas bahwa 1 hanya mendapat skor sekali dalam 6 lemparan adalah (3125/46656) * 6 = 3125/7776

Anda dapat memperluas pengembangan yang sama untuk acara dengan probabilitas 1 / n. Kemungkinan kejadian hanya terjadi satu kali dalam n percobaan

((n-1)/n)^(n-1)

Ini mungkin terlihat agak akrab ketika saya mengatur ulang:

(1-1/n)^(n-1)

Bagian lain dari pertanyaan Anda: mengurangi penyimpangan dengan bertambahnya jumlah sampel, sudah dijelaskan dengan baik dalam jawaban lain.

GPS
sumber
Sayangnya, jawaban yang disorot tidak benar.
Dilip Sarwate