Katakanlah kita memiliki dua koin bias C1
dan C2
keduanya memiliki kemungkinan berbeda untuk berbalik.
Kita membuang C1
n1
waktu dan mendapatkan H1
kepala, C2
n2
waktu dan mendapatkan H2
kepala. Dan kami menemukan bahwa rasio kepala untuk satu koin lebih tinggi daripada yang lain.
Berapa probabilitas yang dapat kita katakan bahwa satu koin lebih baik daripada yang lain? (lebih baik di sini berarti kemungkinan yang lebih tinggi untuk berbalik).
probability
bernoulli-distribution
Thirupathi Thangavel
sumber
sumber
Jawaban:
Mudah untuk menghitung probabilitas untuk melakukan pengamatan itu, mengingat fakta bahwa kedua koin itu sama. Ini dapat dilakukan dengan uji eksak Fishers . Diberikan pengamatan ini
probabilitas untuk mengamati angka-angka ini sementara koin-koinnya sama mengingat jumlah percobaan , dan jumlah total kepala adalahn1 n2 H1+H2 p(H1,H2|n1,n2,H1+H2)=(H1+H2)!(n1+n2−H1−H2)!n1!n2!H1!H2!(n1−H1)!(n2−H2)!(n1+n2)!.
Tetapi yang Anda minta adalah probabilitas bahwa satu koin lebih baik. Karena kami berdebat tentang kepercayaan tentang seberapa bias koin kita, kita harus menggunakan pendekatan Bayesian untuk menghitung hasilnya. Harap dicatat, bahwa dalam kesimpulan Bayesian istilah kepercayaan dimodelkan sebagai probabilitas dan kedua istilah tersebut digunakan secara bergantian ( probabilitas Bayesian ). Kami menyebut probabilitas bahwa koin melempar kepala . Distribusi posterior setelah pengamatan, untuk ini diberikan oleh teorema Bayes : The fungsi kepadatan probabilitas (pdf)i pi pi f(pi|Hi,ni)=f(Hi|pi,ni)f(pi)f(ni,Hi) f(Hi|pi,ni) diberikan oleh probabilitas Binomial, karena percobaan individu adalah eksperimen Bernoulli:
Saya berasumsi pengetahuan sebelumnya tentang adalah bahwa bisa terletak di antara dan dengan probabilitas yang sama, maka . Jadi nominatornya adalah .f(Hi|pi,ni)=(niHi)pHii(1−pi)ni−Hi f(pi) pi 0 1 f(pi)=1 f(Hi|pi,ni)f(pi)=f(Hi|pi,ni)
Untuk menghitung kami menggunakan fakta bahwa integral dari pdf harus satu . Jadi penyebut akan menjadi faktor konstan untuk mencapai hal itu. Ada pdf yang dikenal yang berbeda dari nominator hanya dengan faktor konstan, yang merupakan distribusi beta . Karenanyaf(ni,Hi) ∫10f(p|Hi,ni)dp=1 f(pi|Hi,ni)=1B(Hi+1,ni−Hi+1)pHii(1−pi)ni−Hi.
Pdf untuk pasangan probabilitas koin independen adalahf(p1,p2|H1,n1,H2,n2)=f(p1|H1,n1)f(p2|H2,n2).
Sekarang kita perlu mengintegrasikan ini pada kasus di mana untuk mengetahui bagaimana kemungkinan koin lebih baik daripada koin :p1>p2 1 2 P(p1>p2)=∫10∫p‘10f(p‘1,p‘2|H1,n1,H2,n2)dp‘2dp‘1=∫10B(p‘1;H2+1,n2−H2+1)B(H2+1,n2−H2+1)f(p‘1|H1,n1)dp‘1
Saya tidak bisa menyelesaikan integral terakhir ini secara analitis tetapi orang dapat menyelesaikannya secara numerik dengan komputer setelah menghubungkan angka-angka. adalah fungsi beta dan adalah fungsi beta tidak lengkap. Perhatikan bahwa karena adalah variabel dan tidak pernah persis sama dengan .B(⋅,⋅) B(⋅;⋅,⋅) P(p1=p2)=0 p1 p2
Mengenai asumsi sebelumnya pada dan komentar tentang itu: Alternatif yang baik untuk memodelkan banyak orang percaya adalah dengan menggunakan beta distribusi . Ini akan mengarah pada probabilitas akhir Dengan begitu orang bisa memodelkan bias yang kuat terhadap koin biasa dengan besar tapi sama , . Itu akan sama dengan melempar koin kali tambahan dan menerima kepala karenanya sama dengan hanya memiliki lebih banyak data. adalah jumlah lemparan yang tidak harus kita lakukanf(pi) Beta(ai+1,bi+1) P(p1>p2)=∫10B(p‘1;H2+1+a2,n2−H2+1+b2)B(H2+1+a2,n2−H2+1+b2)f(p‘1|H1+a1,n1+a1+b1)dp‘1. ai bi ai+bi ai ai+bi jika kita memasukkan ini sebelumnya.
OP menyatakan bahwa kedua koin itu bias ke tingkat yang tidak diketahui. Jadi saya mengerti semua pengetahuan harus disimpulkan dari pengamatan. Inilah sebabnya mengapa saya memilih untuk informasi sebelum dosis yang tidak bias hasilnya misalnya terhadap koin biasa.
Semua informasi dapat disampaikan dalam bentuk per koin. Tidak adanya informasi sebelumnya hanya berarti diperlukan lebih banyak pengamatan untuk memutuskan koin mana yang lebih baik dengan probabilitas tinggi.(Hi,ni)
Berikut adalah kode dalam R yang menyediakan fungsi menggunakan seragam sebelumnya :=P(p1>p2) f(pi)=1
P(n1, H1, n2, H2)
Anda dapat menggambar untuk hasil eksperimen yang berbeda dan memperbaiki , misalnya dengan kode ini diambil:P(p1>p2) n1 n2 n1=n2=4
Anda mungkin perlu
install.packages("lattice")
terlebih dahulu.Orang dapat melihat, bahwa bahkan dengan seragam sebelumnya dan ukuran sampel yang kecil, probabilitas atau keyakinan bahwa satu koin lebih baik dapat menjadi cukup solid, ketika dan cukup berbeda. Perbedaan relatif lebih kecil diperlukan jika dan bahkan lebih besar. Ini adalah plot untuk dan :H1 H2 n1 n2 n1=100 n2=200
Martijn Weterings menyarankan untuk menghitung distribusi probabilitas posterior untuk perbedaan antara dan . Ini dapat dilakukan dengan mengintegrasikan pdf dari pasangan ke set :p1 p2 S(d)={(p1,p2)∈[0,1]2|d=|p1−p2|} f(d|H1,n1,H2,n2)=∫S(d)f(p1,p2|H1,n1,H2,n2)dγ=∫1−d0f(p,p+d|H1,n1,H2,n2)dp+∫1df(p,p−d|H1,n1,H2,n2)dp
Sekali lagi, bukan integral yang bisa saya pecahkan secara analitis tetapi kode R adalah:
Saya merencanakan untuk , , dan semua nilai :f(d|n1,H1,n2,H2) n1=4 H1=3 n2=4 H2
Anda dapat menghitung probabilitasberada di atas nilai oleh . Pikiran bahwa aplikasi ganda integral numerik dilengkapi dengan beberapa kesalahan numerik. Misalnya harus selalu sama dengan karena selalu mengambil nilai antara dan . Tetapi hasilnya sering sedikit menyimpang.|p1−p2| d 1 d 0 1
integrate(fd, d, 1, n1, H1, n2, H2)
integrate(fd, 0, 1, n1, H1, n2, H2)
sumber
Saya telah membuat simulasi numerik
R
, mungkin Anda sedang mencari jawaban analitis, tetapi saya pikir ini bisa menarik untuk dibagikan.Dalam kode pertama ini, saya hanya mensimulasikan dua lemparan koin. Di sini Anda dapat melihat tentu saja itu
theta1 > theta2
, maka tentu saja frekuensinyaH1
akan lebih tinggi dariH2
. Catatan yang berbedaN1
,N2
ukuran.Mari kita lihat apa yang bisa kita lakukan dengan yang berbeda
thetas
. Perhatikan kodenya tidak optimal. Sama sekali.Jadi 0,93 adalah frekuensi kali (dari 100) bahwa koin pertama memiliki lebih banyak kepala. Ini sepertinya ok, melihat
theta1
dantheta2
menggunakan.Mari kita lihat dengan dua vektor
thetas
.Ingat itu
res_v
adalah frekuensi di manaH1 > H2
, dari 100 simulasi.Jadi dengan
theta1
meningkatnya, maka kemungkinanH1
menjadi lebih tinggi meningkat, tentu saja.Saya sudah melakukan beberapa simulasi lain dan sepertinya ukurannya
N1
,N2
kurang penting.Jika Anda terbiasa,
R
Anda dapat menggunakan kode ini untuk menjelaskan masalah ini. Saya sadar ini bukan analisis lengkap, dan ini bisa diperbaiki.sumber
res_v
perubahan terus menerus ketika thetas bertemu. Saya memahami pertanyaan itu ketika menanyakan tentang bias intrinsik koin setelah melakukan pengamatan tunggal. Anda tampaknya menjawab pengamatan apa yang akan dilakukan seseorang setelah mengetahui bias.