G-test vs uji chi-square Pearson

10

Saya menguji independensi dalam tabel kontingensi Saya tidak tahu apakah G-test atau uji chi-square Pearson lebih baik. Ukuran sampel ada dalam ratusan tetapi ada beberapa jumlah sel yang rendah. Seperti yang dinyatakan pada halaman Wikipedia , perkiraan untuk distribusi chi-squared lebih baik untuk G-test daripada untuk uji chi-squared Pearson. Tapi saya menggunakan simulasi Monte Carlo untuk menghitung nilai-p, jadi apakah ada perbedaan antara kedua tes ini?N×M.

oodkan
sumber

Jawaban:

8

Mereka asimtotik sama. Mereka hanya cara berbeda untuk mendapatkan ide yang sama. Lebih khusus lagi, uji chi-square Pearson adalah tes skor, sedangkan G-test adalah tes rasio kemungkinan. Untuk memahami ide-ide itu dengan lebih baik, ada baiknya Anda membaca jawaban saya di sini: Mengapa nilai-p saya berbeda antara output regresi logistik, uji chi-square, dan interval kepercayaan untuk OR? Untuk menjawab pertanyaan langsung Anda, jika Anda menghitung nilai p dengan simulasi Monte Carlo, itu tidak masalah; Anda bisa menggunakan mana saja yang lebih nyaman bagi Anda. Perhatikan bahwa tidak ada masalah dengan jumlah sel yang rendah, hanya (berpotensi) yang diharapkan rendahjumlah sel; adalah mungkin untuk memiliki jumlah sel yang rendah dan jumlah yang diharapkan baik-baik saja. Lebih jauh lagi, baik jumlah aktual rendah maupun jumlah ekspektasi rendah tidak penting ketika nilai-p ditentukan oleh simulasi.

(Untuk apa nilainya, saya mungkin akan menggunakan chi-kuadrat Pearson, karena R memiliki fungsi yang nyaman untuk itu yang mencakup opsi untuk mensimulasikan nilai-p.)

gung - Pasang kembali Monica
sumber
apa fungsi dalam R?
llewmills
@ llewmills chisq.test,.
gung - Reinstate Monica
1

Lihatlah Rfast. https://cran.r-project.org/web/packages/Rfast/index.html Perintah yang relevan adalah g2Test_univariate (data, dc) g2Test_univariate_perm (data, dc, nperm) Perhitungannya sangat cepat. Dan secara umum lebih suka tes G2 karena Chi-square adalah perkiraan untuk itu.

Michail
sumber
-1

Uji chi-square dan G-test biasanya menghasilkan hasil yang serupa. Tetapi hal yang paling penting di sini adalah Anda harus memilih satu dari dua tes dan tetap menggunakannya, tidak hanya untuk tes yang disebutkan tetapi untuk tes di masa depan selama penelitian Anda. Dianjurkan karena jika Anda mencoba menggunakan kedua tes secara bergantian, sangat mungkin bahwa Anda akan meningkatkan kemungkinan mendapatkan false positive.

monster kecil
sumber
2
Apa alasan di mana klaim bahwa peluang false positive meningkat? (Kecuali jika Anda bermaksud menyarankan tes dipilih dengan mengacu pada jumlah aktual - tapi kemudian itu merujuk pada jumlah untuk memilih di antara mereka yang menjadi masalah, daripada gagasan berpotensi bertukar tes per se)
Glen_b -Reinstate Monica
2
@Glen_b Peluang mendapatkan False Positive kemungkinan meningkat jika kita memilih nilai p dari tes yang lebih menguntungkan asumsi kita (jika kita mencoba kedua tes)
little_monster