Mengapa rasio odds dari formula dan fisher'stest berbeda? Yang mana yang harus dipilih?

14

Dalam contoh berikut

> m = matrix(c(3, 6, 5, 6), nrow=2)
> m
     [,1] [,2]
[1,]    3    5
[2,]    6    6
> (OR = (3/6)/(5/6))    #1
[1] 0.6
> fisher.test(m)        #2

    Fisher's Exact Test for Count Data

data:  m 
p-value = 0.6699
alternative hypothesis: true odds ratio is not equal to 1 
95 percent confidence interval:
 0.06390055 5.07793271 
sample estimates:
odds ratio 
 0.6155891

Saya menghitung rasio odds (# 1) "secara manual", 0,600; kemudian (# 2) sebagai salah satu output dari uji eksak Fisher, 0,616.

Mengapa saya tidak mendapatkan nilai yang sama?

Mengapa beberapa cara menghitung odds-ratio ada, dan bagaimana memilih yang paling tepat?

r odds-ratio fishers-exact pemenang
sumber

10

Dari halaman bantuan untuk fisher.test():

Perhatikan bahwa Estimasi Kemungkinan Maksimum bersyarat (MLE) daripada MLE tanpa syarat (rasio peluang sampel) digunakan.

zx8754
sumber

3

Untuk menambah diskusi di sini, penting untuk bertanya apa sebenarnya yang dikondisikan dalam kemungkinan "kondisional" ini. Uji Fisher berbeda dari analisis kategorikal lain karena menganggap semua margin tabel diperbaiki sementara model regresi logistik (dan uji chi-square Pearson yang sesuai yang merupakan tes skor dari model logistik) hanya menganggap satu margin diperbaiki .

Uji Fisher kemudian mempertimbangkan distribusi hipergeometrik sebagai model probabilitas untuk jumlah yang diamati pada masing-masing 4 sel. Distribusi hypergeometrik memiliki kekhasan bahwa, karena distribusi rasio odds yang berasal tidak kontinu, Anda sering mendapatkan OR yang berbeda sebagai perkiraan kemungkinan maksimum.

AdamO
sumber

2

Saya tidak berpikir jawaban Anda menjelaskan bagaimana kemungkinan ini muncul. Jika Anda memodelkan proses pembuatan data dengan binomial produk, katakanlah, Anda mendapatkan kemungkinan (& MLE) yang berbeda pada total marjinal, dari apa yang Anda dapatkan jika Anda memodelkannya dengan distribusi hypergeometrik non-sentral Wallenius - marginal total "dianggap tetap" dalam kedua kasus.

Scortchi

1

Untuk menjawab pertanyaan kedua Anda, biostats bukan keahlian saya, tetapi saya percaya alasan untuk statistik rasio odds berganda adalah untuk memperhitungkan desain pengambilan sampel dan desain eksperimen.

Saya telah menemukan tiga referensi di sini yang akan memberi Anda sedikit pemahaman tentang mengapa ada perbedaan antara MLE bersyarat vs tanpa syarat untuk rasio odds, serta jenis lainnya.

Jon
sumber

3

Akan bermanfaat untuk merangkum setidaknya sedikit apa yang dikatakan oleh referensi tersebut.

Scortchi

@Scortchi, setuju. Saya sibuk dengan pekerjaan dan hanya memiliki kesempatan untuk membaca masing-masing halaman pertama atau kedua. Saya akan menambahkan ringkasan setiap akhir pekan ini.

Jon

@Jon Jika Anda bisa, akan berguna untuk menambahkan ringkasan singkat itu

Glen_b -Reinstate Monica

@Jon, saya hanya bertanya satu pertanyaan. Itu bli yang menambahkan pertanyaan kedua 4 tahun setelah saya memposting pertanyaan asli saya. Saya tidak membalikkan suntingan bli yang menyebalkan saat Anda mereferensikan pertanyaan kedua, tetapi saya tidak yakin bagaimana menerima jawaban lagi.

winerd

Mengapa rasio odds dari formula dan fisher'stest berbeda? Yang mana yang harus dipilih?

Jawaban: