Uji Tepat Fisher dan Distribusi Hipergeometrik

12

Saya ingin memahami uji pasti fisher dengan lebih baik, jadi saya menyusun contoh mainan berikut ini, di mana f dan m berhubungan dengan pria dan wanita, dan n dan y berhubungan dengan "konsumsi soda" seperti ini:

> soda_gender

    f m
  n 0 5
  y 5 0

Jelas, ini adalah penyederhanaan yang drastis, tetapi saya tidak ingin konteksnya menghalangi. Di sini saya hanya berasumsi bahwa laki-laki tidak minum soda dan perempuan minum soda, dan ingin melihat apakah prosedur statistik sampai pada kesimpulan yang sama.

Ketika saya menjalankan tes fisher exact di R, saya mendapatkan hasil berikut:

> fisher.test(soda_gender)
Fisher's Exact Test for Count Data

data:  soda_gender
p-value = 0.007937
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
 0.0000000 0.4353226
sample estimates:
odds ratio 
         0 

Di sini, karena nilai-p adalah 0,007937, kita akan menyimpulkan bahwa konsumsi gender dan soda terkait.

Saya tahu bahwa uji fisher-exact terkait dengan distribusi hypergeomteric. Jadi saya ingin mendapatkan hasil yang serupa menggunakan itu. Dengan kata lain, Anda dapat melihat masalah ini sebagai berikut: ada 10 bola, di mana 5 dilabeli sebagai "laki-laki", dan 5 dilabeli sebagai "perempuan", dan Anda menggambar 5 bola secara acak tanpa penggantian, dan Anda melihat 0 bola jantan . Apa peluang pengamatan ini? Untuk menjawab pertanyaan ini, saya menggunakan perintah berikut:

> phyper(q=0,m=5,n=5,k=5,lower.tail=TRUE)
[1] 0.003968254

Pertanyaan saya adalah: 1) Kenapa kedua hasil itu berbeda? 2) Apakah ada yang salah atau tidak teliti dalam alasan saya di atas?

Alby
sumber

Jawaban:

10

Uji pasti Fisher bekerja dengan mengkondisikan margin meja (dalam hal ini, 5 pria dan wanita dan 5 peminum soda dan bukan peminum). Di bawah asumsi hipotesis nol, probabilitas sel untuk mengamati peminum minuman soda pria, peminum minuman soda jantan, peminum minuman soda wanita, atau peminum minuman soda wanita semuanya sama-sama berpeluang (0,25) karena total margin.

Tabel khusus yang Anda gunakan untuk FET tidak memiliki tabel selain dari kebalikannya, 5 wanita peminum non-soda dan 5 pria peminum soda, yang "setidaknya sama tidak mungkin" di bawah hipotesis nol. Jadi, Anda akan melihat bahwa menggandakan probabilitas yang Anda peroleh dalam kepadatan hipergeometrik Anda memberi Anda nilai p FET.

AdamO
sumber
Catatan Meng tentang phyper dan fisher.test (yang melakukan hal yang sama, tetapi memiliki antarmuka yang sangat berbeda) sangat membantu: mengnote.blogspot.qa/2012/12/…
Aditya