Uji Fisher dalam R

11

Misalkan kita memiliki kumpulan data berikut:

                Men    Women    
Dieting         10      30
Non-dieting     5       60

Jika saya menjalankan tes pasti Fisher di R maka apa yang alternative = greatermenyiratkan (atau kurang)? Sebagai contoh:

mat = matrix(c(10,5,30,60), 2,2)
fisher.test(mat, alternative="greater")

Saya mendapatkan p-value = 0.01588dan odds ratio = 3.943534. Juga, ketika saya membalik baris dari tabel darurat seperti ini:

mat = matrix(c(5,10,60,30), 2, 2)
fisher.test(mat, alternative="greater")

maka saya mendapatkan p-value = 0.9967dan odds ratio = 0.2535796. Tetapi, ketika saya menjalankan dua tabel kontingensi tanpa argumen alternatif (yaitu, fisher.test(mat)) maka saya mendapatkan p-value = 0.02063.

  1. Bisakah Anda jelaskan alasannya kepada saya?
  2. Juga, apa hipotesis nol dan hipotesis alternatif dalam kasus-kasus di atas?
  3. Bisakah saya menjalankan tes fisher pada tabel kontingensi seperti ini:

    mat = matrix(c(5000,10000,69999,39999), 2, 2)

PS: Saya bukan ahli statistik. Saya mencoba mempelajari statistik sehingga bantuan Anda (jawaban dalam bahasa Inggris sederhana) akan sangat dihargai.

Snape
sumber

Jawaban:

11

greater(atau less) mengacu pada tes satu sisi yang membandingkan hipotesis nol p1=p2dengan alternatif p1>p2(atau p1<p2). Sebaliknya, tes dua sisi membandingkan hipotesis nol dengan alternatif yang p1tidak sama p2.

Untuk meja Anda, proporsi pelaku diet yang berjenis kelamin pria adalah 1/4 = 0,25 (10 dari 40) dalam sampel Anda. Di sisi lain, proporsi bukan pelaku diet yang berjenis kelamin laki-laki adalah 1/13 atau (5 dari 65) sama dengan 0,077 dalam sampel. Maka estimasi untuk p1adalah 0,25 dan untuk p2adalah 0,077. Karena itu kelihatannya p1>p2.

Itu sebabnya untuk alternatif satu sisi, p1>p2nilai p adalah 0,01588. (Nilai-p kecil menunjukkan hipotesis nol tidak mungkin dan alternatifnya mungkin.)

Ketika alternatifnya adalah p1<p2kita melihat bahwa data Anda menunjukkan bahwa perbedaannya ada di arah yang salah (atau tidak terduga).

Itu sebabnya dalam kasus itu nilai-p sangat tinggi 0,9967. Untuk alternatif dua sisi, nilai p harus sedikit lebih tinggi daripada untuk alternatif satu sisi p1>p2. Dan memang, itu dengan p-value sama dengan 0,02063.

Michael R. Chernick
sumber
1
Penjelasan yang fantastis. Jadi, tes eksak fisher sebenarnya membandingkan probabilitas antara baris yang bertentangan dengan kolom?
Christian
@Christian: Tidak, tidak masalah apakah baris atau kolomnya saat uji fisher memeriksa korelasi dalam tabel kontingensi. Baris dan kolom tidak penting secara langsung. Anda juga bisa saja merumuskan ulang hipotesis: alih-alih H0 menjadi "orang yang merokok mati lebih muda" Anda juga bisa mengasumsikan H0: "orang yang meninggal lebih muda lebih cenderung merokok". Hasil uji fisher akan memberi tahu Anda apakah koneksi yang diamati dalam data mendukung hipotesis nol atau tidak, tetapi tidak masalah yang merupakan variabel independen atau dependen dan sama-sama pilihan baris / kolom tidak masalah: )
Dominique Paul