Distribusi apa yang diasumsikan oleh uji Fisher?

11

Dalam pekerjaan saya, saya telah melihat beberapa kegunaan uji eksak Fisher, dan saya bertanya-tanya seberapa cocok dengan data saya. Melihat beberapa sumber saya mengerti bagaimana menghitung statistik, tetapi tidak pernah melihat penjelasan yang jelas dan formal dari hipotesis nol yang diasumsikan.

Bisakah seseorang tolong jelaskan atau rujuk saya ke penjelasan formal tentang distribusi yang diasumsikan? Akan berterima kasih atas penjelasan dalam hal nilai-nilai dalam tabel kontingensi.

Amit Lavon
sumber
3
Dalam kasus 2x2 ini didasarkan pada distribusi hypergeometric.
Glen_b -Reinstate Monica

Jawaban:

11

Dalam kasus asumsi distribusi diberikan oleh dua variabel acak binomial independen dan . Hipotesis nol adalah kesetaraan . Tetapi uji eksak Fisher adalah uji bersyarat: ia bergantung pada distribusi bersyarat diberikan . Distribusi ini adalah distribusi hypergeometrik dengan satu parameter yang tidak diketahui: rasio odds , lalu hipotesis nol adalah .2×2X1Bin(n1,θ1)X2Bin(n2,θ2)θ1=θ2X1X1+X2ψ=θ11θ1θ21θ2ψ=1

Distribusi ini memiliki halaman Wikipedia .

Untuk mengevaluasinya dengan R, Anda cukup menggunakan rumus yang mendefinisikan probabilitas bersyarat:

p1 <- 7/27
p2 <- 14/70
x1 <- 7; n1 <- 27
x2 <- 14; n2 <- 56
# 
m <- x1+x2
dbinom(x1, n1, p1)*dbinom(x2, n2, p2)/sum(dbinom(0:m, n1, p1)*dbinom(m-(0:m), n2, p2))
[1] 0.1818838

Atau gunakan dnoncenhypergeomfungsi MCMCpackpaket:

psi <- p1/(1-p1)/(p2/(1-p2)) # this is the odds ratio
MCMCpack::dnoncenhypergeom(x=x1, n1, n2, x1+x2, psi)
[1] 0.1818838
Stéphane Laurent
sumber
@Stephane terima kasih. Bisakah Anda jelaskan lebih lanjut mengapa itu menjadi hypergeometric, dan apa parameternya?
Amit Lavon
2
Maaf @AmitLavon, saya tidak tahu detail tentang distribusi hypergeometrik ini.
Stéphane Laurent
1
@AmitLavon Saya baru saja mengedit jawaban saya untuk menyertakan tautan ke wikipedia dan kode R.
Stéphane Laurent
10

Disebut "tepat" test Fisher membuat jenis yang sama asumsi halus yang tes membuat.χ2

  • Dua variabel yang dinilai untuk asosiasi adalah benar-benar semua-atau-tidak ada variabel politytous seperti mati / hidup AS / Eropa. Jika satu atau kedua variabel merupakan penyederhanaan dari kontinum yang mendasari, analisis data kategorikal tidak boleh dilakukan sama sekali.
  • Tidak ada variabel latar belakang lain yang relevan. Jika adalah variabel hasil dan adalah variabel yang dinilai untuk hubungan dengan , probabilitas bahwa identik untuk setiap subjek dengan tetap pada . Tabel kontingensi berasumsi berlaku bahwa tidak ada heterogenitas dalam distribusi yang tidak dicatat oleh . Misalnya, dalam uji klinis acak yang mempelajari efek pengobatan A vs B pada kemungkinan kematian,X Y Y = y X x Y X 2 × 2YXYY=yXxYX2×2uji tabel kontijensi mengasumsikan bahwa setiap subjek pada pengobatan A memiliki probabilitas kematian yang sama. [Orang bisa berpendapat bahwa ini adalah asumsi yang terlalu ketat, tetapi posisi itu tidak mengakui hilangnya kekuatan dari melakukan tes asosiasi yang tidak disesuaikan.]

Uji Fisher membuat satu asumsi yang tidak dibuat dengan uji asosiasi tanpa syarat seperti uji Pearson : bahwa kami tertarik pada distribusi marjinal "saat ini" baik dan , yaitu, kami mengkondisikan pada frekuensi kategori hasil. Ini tidak masuk akal untuk studi prospektif. Penggunaan uji Fisher mengarah ke konservatisme. Nilai- -nya rata-rata terlalu besar, karena tes menjamin bahwa nilai- tidak terlalu kecil. Rata-rata, nilai Pearson lebih akurat daripada nilai Fisher, bahkan dengan frekuensi yang diharapkan jauh lebih rendah dari 5 di beberapa sel. X Y Y P P χ 2 Pχ2XYYPPχ2 P

Frank Harrell
sumber
Terima kasih @ FrankHarrell. Bisakah Anda memberikan referensi untuk klaim Anda tentang nilai chi-square yang lebih akurat daripada nilai Fisher?
Amit Lavon
1
Lihat misalnya citeulike.org/user/harrelfe/tag/fishers-exact-test . Ini telah dibahas panjang lebar di stackexchange.
Frank Harrell
sayangnya ctiteulike hilang dan web.archive.org sepertinya hanya merangkak ke halaman pertama akun harrelfe.
Glen_b -Reinstate Monica