Dengan probabilitas berapa satu koin lebih baik dari yang lain?

Mudah untuk menghitung probabilitas untuk melakukan pengamatan itu, mengingat fakta bahwa kedua koin itu sama. Ini dapat dilakukan dengan uji eksak Fishers . Diberikan pengamatan ini

\begin{array}{rcc} coin 1 & coin 2 \\ heads & H_{1} & H_{2} \\ tails & n_{1} - H_{1} & n_{2} - H_{2} \end{array}

$\begin{array} {r|c|c} &\text{coin }1 &\text{coin }2 \\ \hline \text{heads} &H_1 &H_2\\ \hline \text{tails} &n_1-H_1 &n_2-H_2\\\end{array}$

probabilitas untuk mengamati angka-angka ini sementara koin-koinnya sama mengingat jumlah percobaan , dan jumlah total kepala adalah $n_1$ $n_2$ $H_1+H_2$

p (H_{1}, H_{2} | n_{1}, n_{2}, H_{1} + H_{2}) = \frac{(H_{1} + H_{2})! (n_{1} + n_{2} - H_{1} - H_{2})! n_{1}! n_{2}!}{H_{1}! H_{2}! (n_{1} - H_{1})! (n_{2} - H_{2})! (n_{1} + n_{2})!} .

$p(H_1, H_2|n_1, n_2, H_1+H_2) = \frac{(H_1+H_2)!(n_1+n_2-H_1-H_2)!n_1!n_2!}{H_1!H_2!(n_1-H_1)!(n_2-H_2)!(n_1+n_2)!}.$

Tetapi yang Anda minta adalah probabilitas bahwa satu koin lebih baik. Karena kami berdebat tentang kepercayaan tentang seberapa bias koin kita, kita harus menggunakan pendekatan Bayesian untuk menghitung hasilnya. Harap dicatat, bahwa dalam kesimpulan Bayesian istilah kepercayaan dimodelkan sebagai probabilitas dan kedua istilah tersebut digunakan secara bergantian ( probabilitas Bayesian ). Kami menyebut probabilitas bahwa koin melempar kepala . Distribusi posterior setelah pengamatan, untuk ini diberikan oleh teorema Bayes : The fungsi kepadatan probabilitas (pdf) $i$ $p_i$ $p_i$

f (p_{i} | H_{i}, n_{i}) = \frac{f (H_{i} | p_{i}, n_{i}) f (p_{i})}{f (n_{i}, H_{i})}

$f(p_i|H_i,n_i)= \frac{f(H_i|p_i,n_i)f(p_i)}{f(n_i,H_i)}$

f (H_{i} | p_{i}, n_{i})

$f(H_i|p_i,n_i)$ diberikan oleh probabilitas Binomial, karena percobaan individu adalah eksperimen Bernoulli: Saya berasumsi pengetahuan sebelumnya tentang adalah bahwa bisa terletak di antara dan dengan probabilitas yang sama, maka . Jadi nominatornya adalah .

f (H_{i} | p_{i}, n_{i}) = (\binom{n_{i}}{H_{i}}) p_{i}^{H_{i}} (1 - p_{i})^{n_{i} - H_{i}}

$f(H_i|p_i,n_i) = \binom{n_i}{H_i}p_i^{H_i}(1-p_i)^{n_i-H_i}$

f (p_{i})

$f(p_i)$

p_{i}

$p_i$

0

$0$

1

$1$

f (p_{i}) = 1

$f(p_i) = 1$

f (H_{i} | p_{i}, n_{i}) f (p_{i}) = f (H_{i} | p_{i}, n_{i})

$f(H_i|p_i,n_i)f(p_i)= f(H_i|p_i,n_i)$

Untuk menghitung kami menggunakan fakta bahwa integral dari pdf harus satu . Jadi penyebut akan menjadi faktor konstan untuk mencapai hal itu. Ada pdf yang dikenal yang berbeda dari nominator hanya dengan faktor konstan, yang merupakan distribusi beta . Karenanya $f(n_i,H_i)$ $\int_0^1f(p|H_i,n_i)\mathrm dp = 1$

f (p_{i} | H_{i}, n_{i}) = \frac{1}{B (H_{i} + 1, n_{i} - H_{i} + 1)} p_{i}^{H_{i}} (1 - p_{i})^{n_{i} - H_{i}} .

$f(p_i|H_i,n_i) = \frac{1}{B(H_i+1, n_i-H_i+1)}p_i^{H_i}(1-p_i)^{n_i-H_i}.$

Pdf untuk pasangan probabilitas koin independen adalah

f (p_{1}, p_{2} | H_{1}, n_{1}, H_{2}, n_{2}) = f (p_{1} | H_{1}, n_{1}) f (p_{2} | H_{2}, n_{2}) .

$f(p_1,p_2|H_1,n_1,H_2,n_2) = f(p_1|H_1,n_1)f(p_2|H_2,n_2).$

Sekarang kita perlu mengintegrasikan ini pada kasus di mana untuk mengetahui bagaimana kemungkinan koin lebih baik daripada koin : $p_1>p_2$ $1$ $2$

\begin{aligned} P (p_{1} > p_{2}) & = \int_{0}^{1} \int_{0}^{p ‘_{1}} f (p ‘_{1}, p ‘_{2} | H_{1}, n_{1}, H_{2}, n_{2}) d p ‘_{2} d p ‘_{1} \\ = \int_{0}^{1} \frac{B (p ‘_{1}; H_{2} + 1, n_{2} - H_{2} + 1)}{B (H_{2} + 1, n_{2} - H_{2} + 1)} f (p ‘_{1} | H_{1}, n_{1}) d p ‘_{1} \end{aligned}

$\begin{align} \mathbb P(p_1>p_2) &= \int_0^1 \int_0^{p‘_1} f(p‘_1,p‘_2|H_1,n_1,H_2,n_2)\mathrm dp‘_2 \mathrm dp‘_1\\ &=\int_0^1 \frac{B(p‘_1;H_2+1,n_2-H_2+1)}{B(H_2+1,n_2-H_2+1)} f(p‘_1|H_1,n_1)\mathrm dp‘_1 \end{align}$

Saya tidak bisa menyelesaikan integral terakhir ini secara analitis tetapi orang dapat menyelesaikannya secara numerik dengan komputer setelah menghubungkan angka-angka. adalah fungsi beta dan adalah fungsi beta tidak lengkap. Perhatikan bahwa karena adalah variabel dan tidak pernah persis sama dengan . $B(\cdot,\cdot)$ $B(\cdot;\cdot,\cdot)$ $\mathbb P(p_1=p_2) = 0$ $p_1$ $p_2$

Mengenai asumsi sebelumnya pada dan komentar tentang itu: Alternatif yang baik untuk memodelkan banyak orang percaya adalah dengan menggunakan beta distribusi . Ini akan mengarah pada probabilitas akhir Dengan begitu orang bisa memodelkan bias yang kuat terhadap koin biasa dengan besar tapi sama , . Itu akan sama dengan melempar koin kali tambahan dan menerima kepala karenanya sama dengan hanya memiliki lebih banyak data. adalah jumlah lemparan yang tidak harus kita lakukan $f(p_i)$ $Beta(a_i+1,b_i+1)$

P (p_{1} > p_{2}) = \int_{0}^{1} \frac{B (p ‘_{1}; H_{2} + 1 + a_{2}, n_{2} - H_{2} + 1 + b_{2})}{B (H_{2} + 1 + a_{2}, n_{2} - H_{2} + 1 + b_{2})} f (p ‘_{1} | H_{1} + a_{1}, n_{1} + a_{1} + b_{1}) d p ‘_{1} .

$\mathbb P(p_1>p_2) =\int_0^1 \frac{B(p‘_1;H_2+1+a_2,n_2-H_2+1+b_2)}{B(H_2+1+a_2,n_2-H_2+1+b_2)} f(p‘_1|H_1+a_1,n_1+a_1+b_1)\mathrm dp‘_1.$

a_{i}

$a_i$

b_{i}

$b_i$

a_{i} + b_{i}

$a_i+b_i$

a_{i}

$a_i$

a_{i} + b_{i}

$a_i + b_i$ jika kita memasukkan ini sebelumnya.

OP menyatakan bahwa kedua koin itu bias ke tingkat yang tidak diketahui. Jadi saya mengerti semua pengetahuan harus disimpulkan dari pengamatan. Inilah sebabnya mengapa saya memilih untuk informasi sebelum dosis yang tidak bias hasilnya misalnya terhadap koin biasa.

Semua informasi dapat disampaikan dalam bentuk per koin. Tidak adanya informasi sebelumnya hanya berarti diperlukan lebih banyak pengamatan untuk memutuskan koin mana yang lebih baik dengan probabilitas tinggi. $(H_i, n_i)$

Berikut adalah kode dalam R yang menyediakan fungsi menggunakan seragam sebelumnya : P(n1, H1, n2, H2) $=\mathbb P(p_1>p_2)$ $f(p_i)=1$

mp <- function(p1, n1, H1, n2, H2) {
    f1 <- pbeta(p1, H2 + 1, n2 - H2 + 1)
    f2 <- dbeta(p1, H1 + 1, n1 - H1 + 1)
    return(f1 * f2)
}

P <- function(n1, H1, n2, H2) {
    return(integrate(mp, 0, 1, n1, H1, n2, H2))
}

Anda dapat menggambar untuk hasil eksperimen yang berbeda dan memperbaiki , misalnya dengan kode ini diambil: $P(p_1>p_2)$ $n_1$ $n_2$ $n_1=n_2=4$

library(lattice)
n1 <- 4
n2 <- 4
heads <- expand.grid(H1 = 0:n1, H2 = 0:n2)
heads$P <- apply(heads, 1, function(H) P(n1, H[1], n2, H[2])$value)
levelplot(P ~ H1 + H2, heads, main = "P(p1 > p2)")

Anda mungkin perlu install.packages("lattice")terlebih dahulu.

Orang dapat melihat, bahwa bahkan dengan seragam sebelumnya dan ukuran sampel yang kecil, probabilitas atau keyakinan bahwa satu koin lebih baik dapat menjadi cukup solid, ketika dan cukup berbeda. Perbedaan relatif lebih kecil diperlukan jika dan bahkan lebih besar. Ini adalah plot untuk dan : $H_1$ $H_2$ $n_1$ $n_2$ $n_1=100$ $n_2=200$

Martijn Weterings menyarankan untuk menghitung distribusi probabilitas posterior untuk perbedaan antara dan . Ini dapat dilakukan dengan mengintegrasikan pdf dari pasangan ke set : $p_1$ $p_2$ $S(d)=\{(p_1,p_2)\in[0,1]^2|d=|p_1-p_2|\}$

\begin{aligned} f (d | H_{1}, n_{1}, H_{2}, n_{2}) & = \int_{S (d)} f (p_{1}, p_{2} | H_{1}, n_{1}, H_{2}, n_{2}) d γ \\ = \int_{0}^{1 - d} f (p, p + d | H_{1}, n_{1}, H_{2}, n_{2}) d p + \int_{d}^{1} f (p, p - d | H_{1}, n_{1}, H_{2}, n_{2}) d p \end{aligned}

$\begin{align} f(d|H_1,n_1,H_2,n_2) &= \int_{S(d)}f(p_1,p_2|H_1,n_1,H_2,n_2) \mathrm d\gamma\\ &= \int_0^{1-d} f(p,p+d|H_1,n_1,H_2,n_2) \mathrm dp + \int_d^1 f(p,p-d|H_1,n_1,H_2,n_2) \mathrm dp\\ \end{align}$

Sekali lagi, bukan integral yang bisa saya pecahkan secara analitis tetapi kode R adalah:

d1 <- function(p, d, n1, H1, n2, H2) {
    f1 <- dbeta(p, H1 + 1, n1 - H1 + 1)
    f2 <- dbeta(p + d, H2 + 1, n2 - H2 + 1)
    return(f1 * f2)
}

d2 <- function(p, d, n1, H1, n2, H2) {
    f1 <- dbeta(p, H1 + 1, n1 - H1 + 1)
    f2 <- dbeta(p - d, H2 + 1, n2 - H2 + 1)
    return(f1 * f2)
}

fd <- function(d, n1, H1, n2, H2) {
    if (d==1) return(0)
    s1 <- integrate(d1, 0, 1-d, d, n1, H1, n2, H2)
    s2 <- integrate(d2, d, 1, d, n1, H1, n2, H2)
    return(s1$value + s2$value)
}

Saya merencanakan untuk , , dan semua nilai : $f(d|n_1,H_1,n_2,H_2)$ $n_1=4$ $H_1=3$ $n_2=4$ $H_2$

n1 <- 4
n2 <- 4
H1 <- 3
d <- seq(0, 1, length = 500)

get_f <- function(H2) sapply(d, fd, n1, H1, n2, H2)
dat <- sapply(0:n2, get_f)

matplot(d, dat, type = "l", ylab = "Density",
        main = "f(d | 4, 3, 4, H2)")
legend("topright", legend = paste("H2 =", 0:n2),
       col = 1:(n2 + 1), pch = "-")

Anda dapat menghitung probabilitasberada di atas nilai oleh . Pikiran bahwa aplikasi ganda integral numerik dilengkapi dengan beberapa kesalahan numerik. Misalnya harus selalu sama dengan karena selalu mengambil nilai antara dan . Tetapi hasilnya sering sedikit menyimpang. $|p_1-p_2|$ $d$ integrate(fd, d, 1, n1, H1, n2, H2)integrate(fd, 0, 1, n1, H1, n2, H2) $1$ $d$ $0$ $1$

katosh
sumber

Saya tidak tahu nilai sebenarnya dari p1

Thirupathi Thangavel

Saya minta maaf untuk notasi buruk saya 😅 tetapi Anda tidak perlu memasukkan nilai tetap untuk . The (sekarang berubah) di integral adalah variabel yang Anda integrasikan. Sama seperti Anda dapat mengintegrasikan tanpa memiliki nilai tetap untuk .

p_{1}

$p_1$

p ‘_{1}

$p‘_1$

\int_{0}^{1} x^{2} d x

$\int_0^1 x^2 \mathrm dx$

x

$x$

katosh

Uji eksak Fisher lebih spesifik tentang hipotesis bahwa koin memiliki probabilitas yang sama dan total marginal tetap . Ini tidak terjadi dalam masalah koin ini. Jika Anda melakukan tes lagi maka Anda dapat mengamati sejumlah total kepala lainnya.

Sextus Empiricus

@ MartijnWeterings dalam kasus saya, kemungkinan memutar kepala untuk koin selalu diperbaiki. Bukankah itu cukup?

Thirupathi Thangavel

@ThirupathiThangavel masalah dengan tes Fisher adalah tentang total marginal yang tidak tetap. Model pengujian yang tepat mengasumsikan bahwa probabilitas kepala adalah sama dan tetap, tetapi juga marjinal diperbaiki sebelum percobaan. Bagian kedua bukan itu masalahnya. Ini memberikan probabilitas bersyarat yang berbeda untuk nilai ekstrem. Secara keseluruhan tes Fisher akan konservatif. Probabilitas hasil yang diberikan hipotesis BENAR (mis. Probabilitas tetap dan serupa untuk kepala, tetapi tidak harus total marginal tetap) lebih kecil dari yang dihitung (Anda mendapatkan nilai p lebih tinggi).

Sextus Empiricus

Saya telah membuat simulasi numerik R, mungkin Anda sedang mencari jawaban analitis, tetapi saya pikir ini bisa menarik untuk dibagikan.

set.seed(123)
# coin 1
N1 = 20
theta1 = 0.7

toss1 <- rbinom(n = N1, size = 1, prob = theta1)

# coin 2
N2 = 25
theta2 = 0.5

toss2 <- rbinom(n = N2, size = 1, prob = theta2)

# frequency
sum(toss1)/N1 # [1] 0.65
sum(toss2)/N2 # [1] 0.52

Dalam kode pertama ini, saya hanya mensimulasikan dua lemparan koin. Di sini Anda dapat melihat tentu saja itu theta1 > theta2, maka tentu saja frekuensinya H1akan lebih tinggi dari H2. Catatan yang berbeda N1, N2ukuran.

Mari kita lihat apa yang bisa kita lakukan dengan yang berbeda thetas. Perhatikan kodenya tidak optimal. Sama sekali.

simulation <- function(N1, N2, theta1, theta2, nsim = 100) {
  count1 <- count2 <- 0

  for (i in 1:nsim) {
    toss1 <- rbinom(n = N1, size = 1, prob = theta1)
    toss2 <- rbinom(n = N2, size = 1, prob = theta2)

    if (sum(toss1)/N1 > sum(toss2)/N2) {count1 = count1 + 1} 
    #if (sum(toss1)/N1 < sum(toss2)/N2) {count2 = count2 + 1} 
  }

  count1/nsim

}
set.seed(123)
simulation(20, 25, 0.7, 0.5, 100)
#[1] 0.93

Jadi 0,93 adalah frekuensi kali (dari 100) bahwa koin pertama memiliki lebih banyak kepala. Ini sepertinya ok, melihat theta1dan theta2menggunakan.

Mari kita lihat dengan dua vektor thetas.

theta1_v <- seq(from = 0.1, to = 0.9, by = 0.1)
theta2_v <- seq(from = 0.9, to = 0.1, by = -0.1)

res_v <- c()
for (i in 1:length(theta1_v)) {

  res <- simulation(1000, 1500, theta1_v[i], theta2_v[i], 100)
  res_v[i] <- res

}

plot(theta1_v, res_v, type = "l")

Ingat itu res_vadalah frekuensi di mana H1 > H2, dari 100 simulasi.

Jadi dengan theta1meningkatnya, maka kemungkinan H1menjadi lebih tinggi meningkat, tentu saja.

Saya sudah melakukan beberapa simulasi lain dan sepertinya ukurannya N1, N2kurang penting.

Jika Anda terbiasa, RAnda dapat menggunakan kode ini untuk menjelaskan masalah ini. Saya sadar ini bukan analisis lengkap, dan ini bisa diperbaiki.

RLave
sumber

Menarik bagaimana res_vperubahan terus menerus ketika thetas bertemu. Saya memahami pertanyaan itu ketika menanyakan tentang bias intrinsik koin setelah melakukan pengamatan tunggal. Anda tampaknya menjawab pengamatan apa yang akan dilakukan seseorang setelah mengetahui bias.

katosh

Dengan probabilitas berapa satu koin lebih baik dari yang lain?

Jawaban: