Apakah chi-square selalu merupakan tes satu sisi?

48

Artikel yang diterbitkan ( pdf ) berisi 2 kalimat ini:

Selain itu, kesalahan pelaporan dapat disebabkan oleh penerapan aturan yang salah atau oleh kurangnya pengetahuan tentang uji statistik. Misalnya, total df dalam ANOVA dapat dianggap sebagai kesalahan df dalam pelaporan uji , atau peneliti dapat membagi nilai p yang dilaporkan dari atau dengan dua, untuk memperoleh nilai satu sisi , sedangkan nilai dari a atau sudah merupakan tes satu sisi.χ 2 F p p χ 2 FFχ2Fppχ2F

Mengapa mereka mengatakan itu? Tes chi-squared adalah tes dua sisi. (Saya telah meminta salah satu penulis, tetapi tidak mendapat jawaban.)

Apakah saya mengabaikan sesuatu?

Joel W.
sumber
Lihatlah latihan 4.14 edisi Davidson & Mackinnon 'Teori dan Metode Econometrik' 2004 untuk contoh (luar biasa) ketika Chi-kuadrat digunakan untuk tes dua sisi. Sunting: penjelasan hebat di sini: itl.nist.gov/div898/handbook/eda/section3/eda358.htm
Maks.

Jawaban:

50

Tes chi-squared pada dasarnya selalu merupakan tes satu sisi . Berikut ini cara berpikir yang longgar: tes chi-squared pada dasarnya adalah tes 'good of of fit'. Kadang-kadang secara eksplisit disebut seperti itu, tetapi bahkan ketika tidak, itu masih sering pada dasarnya kebaikan. Misalnya, uji independensi chi-kuadrat pada tabel frekuensi 2 x 2 adalah (semacam) uji goodness of fit dari baris pertama (kolom) untuk distribusi yang ditentukan oleh baris kedua (kolom), dan sebaliknya secara bersamaan. Jadi, ketika nilai chi-squared yang terealisasi berada di ujung kanan dari distribusi itu, itu menunjukkan kecocokan yang buruk, dan jika itu cukup jauh, relatif terhadap beberapa ambang yang ditentukan sebelumnya, kita dapat menyimpulkan bahwa itu sangat buruk kami tidak percaya data berasal dari distribusi referensi itu.

Jika kita menggunakan uji chi-squared sebagai tes dua sisi, kita juga akan khawatir jika statistiknya terlalu jauh ke sisi kiri distribusi chi-squared. Ini berarti bahwa kami khawatir kecocokan itu mungkin terlalu baik . Ini bukan sesuatu yang biasanya kita khawatirkan. (Sebagai catatan sejarah, ini terkait dengan kontroversi apakah Mendel memalsukan data. Idenya adalah bahwa datanya terlalu bagus untuk menjadi kenyataan. Lihat di sini untuk info lebih lanjut jika Anda penasaran.)

gung - Reinstate Monica
sumber
9
+1 untuk menyebutkan penggunaan dua sisi dengan eksperimen kacang Mendel: mudah diingat dan menyentuh inti pertanyaan.
whuber
2
+1 untuk pertanyaan yang bagus dan jawaban yang bagus. @ Joel W: Saya sangat dapat merekomendasikan Khan Academys video pada tesχ2
Max Gordon
9
Ringkasan saya tentang ini adalah bahwa adalah tes dua sisi yang biasanya kita hanya tertarik pada salah satu ekor dari distribusi, menunjukkan lebih banyak ketidaksepakatan, daripada lebih sedikit ketidaksepakatan daripada yang diharapkan secara kebetulan. χ2
Frank Harrell
5
Mendukung tampilan 2-tailed: "Probabilitas dua-ekor di luar +/- z untuk distribusi normal standar sama dengan probabilitas kanan-ekor di atas z-kuadrat untuk distribusi chi-kuadrat dengan df = 1. Misalnya, dua probabilitas normal standar berekor 0,05 yang jatuh di bawah -1,96 dan di atas 1,96 sama dengan probabilitas chi-kuadrat ekor kanan di atas (1,96) kuadrat = 3,84 ketika df = 1. " Agresti, 2007 (edisi kedua) halaman 11
Joel W.
5
Tepat sekali. Mengkuadratkan skor-z menghasilkan varian chi-kuadrat. Misalnya, az dari 2 (atau, -2!) Ketika kuadrat sama dengan 4, nilai chi-kuadrat yang sesuai. Nilai p dua sisi yang dikaitkan dengan skor-z 2 adalah 0,04550026; dan nilai p satu-ekor yang terkait dengan nilai chi-squared dari 4 (df = 1) adalah 0,04550026. Uji z dua sisi berhubungan dengan uji chi-squared satu sisi. Melihat ekor kiri distribusi chi-kuadrat akan sesuai dengan mencari skor-z yang lebih dekat ke z = 0 daripada yang mungkin Anda harapkan secara kebetulan.
gung - Reinstate Monica
12

Apakah chi-square selalu merupakan tes satu sisi?

Itu sangat tergantung pada dua hal:

  1. hipotesis apa yang sedang diuji. Jika Anda menguji varians data normal terhadap nilai yang ditentukan, sangat mungkin untuk berurusan dengan ekor atas atau bawah dari chi-square (satu-ekor), atau kedua ekor dari distribusi. Kita harus ingat bahwa Statistik tipe bukan satu-satunya tes chi-square di kota!(OE)2E

  2. apakah orang berbicara tentang hipotesis alternatif menjadi satu atau dua sisi (karena beberapa orang menggunakan 'dua sisi' untuk merujuk pada alternatif dua sisi, terlepas dari apa yang terjadi dengan distribusi sampling statistik . Kadang-kadang dapat membingungkan. Jadi misalnya, jika kita melihat tes proporsi dua sampel, seseorang mungkin dalam nol menulis bahwa kedua proporsi itu sama dan dalam alternatif menulis bahwaπ1π2dan kemudian membicarakannya sebagai 'berekor dua', tetapi mengujinya menggunakan chi-square daripada uji-z, dan hanya melihat pada bagian atas dari distribusi statistik uji (jadi dua sisi dalam hal distribusi perbedaan dalam proporsi sampel, tetapi satu ekor dalam hal distribusi statistik chi-square diperoleh dari itu - dalam banyak cara yang sama bahwa jika Anda membuat t-test Anda statistik , Anda hanya melihat satu ekor dalam distribusi ).|T||T|

Artinya, kita harus sangat berhati-hati tentang apa yang ingin kita bahas dengan menggunakan 'uji chi-square' dan tepat tentang apa yang kita maksudkan ketika kita mengatakan 'satu-ekor' vs 'dua-ekor'.

Dalam beberapa keadaan (dua yang saya sebutkan; mungkin ada lebih banyak), mungkin masuk akal untuk menyebutnya dua sisi, atau mungkin masuk akal untuk menyebutnya dua sisi jika Anda menerima kelonggaran penggunaan terminologi.

Mungkin pernyataan yang masuk akal untuk mengatakan itu hanya satu-ekor jika Anda membatasi diskusi untuk jenis tes chi-square tertentu.

Glen_b
sumber
bagaimana dengan yang ini? stats.stackexchange.com/questions/223560/…
Seorang lelaki tua di laut.
Terima kasih banyak untuk menyebutkan tes varians. Itu sebenarnya adalah penggunaan tes yang cukup menarik, dan juga alasan mengapa saya berakhir di halaman ini ^^
Tobbey
5

Uji chi-square dari hipotesis bahwa variansnya adalah dapat berupa satu atau dua ekor dalam arti yang persis sama dengan uji-t dari hipotesis bahwa mean adalah dapat berupa satu atau dua sisi.(n1)s2/σ2σ2(mμ)n/sμ

Ray Koopman
sumber
1

Jawaban @ gung benar dan cara diskusi harus dibaca. Namun, kebingungan dapat timbul dari bacaan lain:χ2

Akan mudah untuk menafsirkan sebagai 'dua sisi' dalam arti bahwa statistik uji biasanya terdiri dari sejumlah perbedaan kuadrat dari kedua sisi dari distribusi asli.χ2

Pembacaan ini akan membingungkan bagaimana statistik uji dihasilkan dengan ekor statistik uji mana yang sedang dilihat.

dugaan
sumber
Bisakah Anda menguraikan apa "sisi distribusi asli" itu? Bahkan tidak jelas apa yang dimaksud dengan "distribusi asli" atau bagaimana hubungannya dengan statistik chi-squared yang dihitung dari data.
whuber
Sebagai contoh, jumlah normals independen yang dikuadratkan adalah . Normalnya adalah distribusi 'asli'. The Stat menggabungkan informasi dari kedua ekor dari distribusi normal yang mendasari. nχ2χ2
dugaan
OK, tapi saya masih tidak tahu apa yang Anda kontras dengan itu. Bisakah Anda memberikan contoh statistik uji non-dua sisi yang dapat digunakan dalam ANOVA dan menunjukkan bagaimana itu terhubung dengan ekor beberapa distribusi?
whuber
Saya tidak kontras dengan apa pun. Saya menunjukkan alasan mengapa orang mungkin bingung tentang jargon satu sisi / dua sisi dalam konteks . Sangat mudah bagi para ahli untuk melihat bahwa itu sendiri biasanya merupakan tes satu sisi pada stat yang dihitung. Orang lain mungkin memiliki beberapa data dan berpikir tentang penyimpangan dari mean di kedua arah, yang sering digulung menjadi stat . Mereka akan mendengar hal-hal di sepanjang garis 'berpikir penyimpangan dari mean di kedua arah = tes dua sisi'. Karena itu kesalahpahaman. χ2χ2χ2
Dugaan
Saya meminta kontras hanya untuk membantu memahami apa yang Anda coba gambarkan. Saya belum bisa menentukan apa itu.
whuber
0

Saya juga memiliki beberapa masalah untuk mengatasi pertanyaan ini juga, tetapi setelah beberapa percobaan sepertinya masalah saya hanya dalam bagaimana tes tersebut dinamai.

Dalam SPSS sebagai contoh, tabel 2x2 dapat memiliki tambahan chisquare-test. Ada dua kolom untuk nilai-p, satu untuk "Pearson Chi-Sqare", "Koreksi Kontinuitas" dll, dan sepasang kolom lain untuk uji eksak Fisher di mana ada satu kolom untuk uji 2 sisi dan satu lagi untuk Tes 1 sisi.

Saya pertama kali berpikir bahwa sisi 1 dan 2 menunjukkan versi 1 atau 2 sisi dari uji chisquare, yang tampak aneh. Namun ternyata ini menunjukkan formulasi yang mendasari hipotesis alternatif dalam uji perbedaan antara proporsi, yaitu uji-z. Jadi, uji proporsi 2 sisi yang wajar sering dilakukan di SPSS dengan uji chisquare, di mana ukuran chisquare dibandingkan dengan nilai di bagian atas (1 sisi) distribusi. Tebak inilah yang telah ditunjukkan oleh tanggapan lain terhadap pertanyaan awal, tetapi saya perlu waktu untuk menyadari hal itu.

Omong-omong, formulasi yang sama digunakan di openepi.com dan mungkin juga sistem lain.

Robert L
sumber
0

χ2 uji varian dapat satu atau dua sisi: Statistik uji adalah , dan hipotesis nolnya adalah: s (deviasi sampel) = (nilai referensi). Hipotesis alternatif dapat berupa: (a) , (b) , (c) . caculation p-value melibatkan asimetri distribusi. σs>σs<σsσ(n1)s2σ2σs>σs<σsσ

shahuss
sumber
1
Selamat datang di CV! Saya pikir jawaban Ray Koopman sudah mencakup hal ini.
Silverfish
-1

Uji dan F adalah uji satu sisi karena kita tidak pernah memiliki nilai negatif dari dan F. Untuk , jumlah perbedaan kuadrat yang diamati dan yang diharapkan dibagi dengan yang diharapkan (proporsi ), dengan demikian chi-square selalu merupakan angka positif atau mungkin mendekati nol di sisi kanan ketika tidak ada perbedaan. Dengan demikian, tes ini selalu merupakan tes satu sisi sisi kanan. Penjelasan untuk uji F serupa.χ 2 χ 2χ2χ2χ2

Untuk uji F, kami membandingkan antara varians grup dengan jumlah dalam varians grup (mean square error ke . Jika antara dan dalam jumlah rata-rata kuadrat sama, kami mendapatkan nilai F dari 1.SSwdfw

Karena pada dasarnya rasio jumlah kuadrat, nilainya tidak pernah menjadi angka negatif. Dengan demikian, kami tidak memiliki tes sisi kiri dan uji F selalu merupakan tes sisi satu sisi kanan. Periksa angka dan F, mereka selalu positif. Untuk kedua tes, Anda melihat apakah statistik yang dihitung terletak di sebelah kanan nilai kritis. χ2

Distribusi Chi-square dan F

Daniel
sumber
1
Statistik uji tidak perlu mengambil nilai negatif bagi kita untuk mempertimbangkan kedua sisi. Pertimbangkan uji F untuk rasio dua varian, misalnya.
Glen_b
Uji F adalah uji satu sisi Glen_b.
Daniel
3
Tes F untuk persamaan varian, yang memiliki statistik bahwa rasio dari dua estimasi varians BUKAN satu sisi; ada perkiraan untuk itu yang menempatkan lebih besar dari dua varian sampel pada pembilang, tapi itu hanya benar jika df sama. Tetapi jika Anda tidak suka ada sejumlah contoh lain. Statistik untuk tes jumlah peringkat tidak boleh negatif tetapi tes ini dua sisi. Saya dapat memberikan contoh lain jika diperlukan.
Glen_b
σ12σ22σ12>σ22