Saya ingin memahami uji pasti fisher dengan lebih baik, jadi saya menyusun contoh mainan berikut ini, di mana f dan m berhubungan dengan pria dan wanita, dan n dan y berhubungan dengan "konsumsi soda" seperti ini:
> soda_gender
f m
n 0 5
y 5 0
Jelas, ini adalah penyederhanaan yang drastis, tetapi saya tidak ingin konteksnya menghalangi. Di sini saya hanya berasumsi bahwa laki-laki tidak minum soda dan perempuan minum soda, dan ingin melihat apakah prosedur statistik sampai pada kesimpulan yang sama.
Ketika saya menjalankan tes fisher exact di R, saya mendapatkan hasil berikut:
> fisher.test(soda_gender)
Fisher's Exact Test for Count Data
data: soda_gender
p-value = 0.007937
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.0000000 0.4353226
sample estimates:
odds ratio
0
Di sini, karena nilai-p adalah 0,007937, kita akan menyimpulkan bahwa konsumsi gender dan soda terkait.
Saya tahu bahwa uji fisher-exact terkait dengan distribusi hypergeomteric. Jadi saya ingin mendapatkan hasil yang serupa menggunakan itu. Dengan kata lain, Anda dapat melihat masalah ini sebagai berikut: ada 10 bola, di mana 5 dilabeli sebagai "laki-laki", dan 5 dilabeli sebagai "perempuan", dan Anda menggambar 5 bola secara acak tanpa penggantian, dan Anda melihat 0 bola jantan . Apa peluang pengamatan ini? Untuk menjawab pertanyaan ini, saya menggunakan perintah berikut:
> phyper(q=0,m=5,n=5,k=5,lower.tail=TRUE)
[1] 0.003968254
Pertanyaan saya adalah: 1) Kenapa kedua hasil itu berbeda? 2) Apakah ada yang salah atau tidak teliti dalam alasan saya di atas?
sumber