Mengapa tes McNemar menggunakan chi-square dan bukan distribusi normal?

11

Saya hanya memperhatikan bagaimana tes McNemar yang tidak tepat menggunakan distribusi asimtotik chi square. Tetapi karena tes yang tepat (untuk dua tabel kasus) bergantung pada distribusi binomial, mengapa tidak umum untuk menyarankan perkiraan normal untuk distribusi binomial?

Terima kasih.

Tal Galili
sumber

Jawaban:

15

Jawaban yang mendekati intuisi:

Perhatikan rumus untuk tes McNemar, mengingat tabelnya

      pos | neg
----|-----|-----
pos |  a  |  b
----|-----|-----
neg |  c  |  d

Statistik McNemar Mdihitung sebagai:

M=(bc)2b+c

Definisi a χ 2χ2 dengan derajat kebebasan k adalah bahwa ia terdiri dari jumlah kuadrat dari variabel normal standar k independen. jika 4 angka cukup besar, bdan c, dan dengan demikian b-cdan b+cdapat didekati dengan distribusi normal. Mengingat rumus untuk M, mudah terlihat bahwa dengan nilai yang cukup besar Mmemang akan mengikuti kira-kira dengan kebebasan 1 derajat.χ2


EDIT: Seperti yang diindikasikan dengan benar, perkiraan normal sebenarnya sama. Itu agak sepele mengingat argumen menggunakan perkiraan b-coleh distribusi normal.

Versi binomial yang tepat juga setara dengan tes tanda, dalam arti bahwa dalam versi ini distribusi binomial digunakan untuk membandingkan bdengan . Atau kita dapat mengatakan bahwa di bawah hipotesis nol, distribusi b dapat diperkirakan dengan .N ( 0,5 × ( b + c ) , 0,5 2 × ( b + c )Binom(b+c,0.5)N(0.5×(b+c),0.52×(b+c)

Atau, yang setara:

b(b+c2)b+c2N(0,1)

yang disederhanakan menjadi

bcb+cN(0,1)

atau, ketika diambil kotak di kedua sisi, ke .Mχ12

Oleh karena itu, pendekatan normal yang digunakan. Ini sama dengan pendekatan .χ2

Joris Meys
sumber
3
Betul. Koneksi mungkin dapat terlihat lebih jelas dengan mempertimbangkan Sqrt (M) = (bc) / Sqrt (b + c). Mendekati varians b sebagai b dan varians c sebagai c (seperti biasa dengan data yang dihitung), kita melihat bahwa Sqrt (M) terlihat seperti varian yang kira-kira normal (bc) dibagi dengan standar deviasi: dengan kata lain, itu terlihat seperti varian normal standar . Bahkan, kita bisa melakukan tes yang setara dengan merujuk Sqrt (M) ke tabel distribusi normal standar. Mengkuadratkan secara efektif membuat tes simetris dua sisi. Jelas ini rusak jika b atau c kecil.
whuber
Terima kasih atas jawaban intuitif Joris. Namun, mengapa lebih umum untuk menggunakan pendekatan ini daripada menggunakan perkiraan normal untuk uji binomial yang tepat dari McNemar?
Tal Galili
@Tal: Sama saja. Lihat jawaban non-stop dan edit saya.
Joris Meys
Sebenarnya - pertanyaan terakhir. Jadi jika keduanya identik (dan saya pikir Anda mungkin juga membutuhkan "nilai absolut" di sekitar SM), lalu mengapa orang pergi ke distribusi chi bukannya tetap dengan yang normal? Di mana keuntungannya?
Tal Galili
1
@Tal: Anda tahu R. plot chi2 dengan satu derajat kebebasan, Anda akan lihat.
Joris Meys
8

Bukankah kedua pendekatan itu akan mencapai hal yang sama? Distribusi chi-square yang relevan memiliki satu derajat kebebasan sehingga hanya distribusi kuadrat dari variabel acak dengan distribusi normal standar. Saya harus memeriksa aljabar untuk memeriksa, yang saya tidak punya waktu untuk melakukannya sekarang, tetapi saya akan terkejut jika Anda tidak mendapatkan jawaban yang persis sama untuk kedua arah.

onestop
sumber
lihat jawaban saya untuk elaborasi lebih lanjut
Joris Meys
Hai onestop - Karena keduanya asimptotik, maka untuk N yang lebih kecil mereka mungkin menghasilkan hasil yang agak berbeda. Dalam kasus seperti itu, saya bertanya-tanya apakah pilihan menggunakan chi-square adalah karena lebih baik daripada perkiraan normal, atau karena alasan historis (atau mungkin, seperti yang Anda sarankan - mereka selalu memberikan hasil yang identik)
Tal Galili
@Tal: untuk N yang lebih kecil, tidak ada yang tahan. Dan seperti yang ditunjukkan dalam edit saya, mereka persis sama.
Joris Meys