Apa hubungan antara uji chi square dan uji proporsi yang sama?

52

Misalkan saya memiliki tiga populasi dengan empat, karakteristik yang saling eksklusif. Saya mengambil sampel acak dari setiap populasi dan membuat tabel tab silang atau frekuensi untuk karakteristik yang saya ukur. Apakah saya benar mengatakan bahwa:

  1. Jika saya ingin menguji apakah ada hubungan antara populasi dan karakteristik (misalnya apakah satu populasi memiliki frekuensi lebih tinggi dari salah satu karakteristik), saya harus menjalankan uji chi-squared dan melihat apakah hasilnya signifikan.

  2. Jika uji chi-kuadrat signifikan, itu hanya menunjukkan kepada saya bahwa ada beberapa hubungan antara populasi dan karakteristik, tetapi tidak bagaimana mereka terkait.

  3. Selain itu, tidak semua karakteristik perlu dikaitkan dengan populasi. Misalnya, jika populasi yang berbeda memiliki distribusi karakteristik A dan B yang berbeda secara signifikan, tetapi tidak dengan C dan D, maka uji chi-kuadrat masih mungkin kembali signifikan.

  4. Jika saya ingin mengukur apakah karakteristik tertentu dipengaruhi oleh populasi atau tidak, maka saya dapat menjalankan tes untuk proporsi yang sama (saya telah melihat ini disebut uji-z, atau seperti prop.test()pada R) hanya pada karakteristik itu.

Dengan kata lain, apakah pantas untuk menggunakan prop.test()untuk lebih akurat menentukan sifat hubungan antara dua set kategori ketika uji chi-square mengatakan bahwa ada hubungan yang signifikan?

hgcrpd
sumber

Jawaban:

23

Jawaban yang sangat singkat:

Uji chi-Squared ( chisq.test()dalam R) membandingkan frekuensi yang diamati dalam setiap kategori tabel kontingensi dengan frekuensi yang diharapkan (dihitung sebagai produk dari frekuensi marginal). Ini digunakan untuk menentukan apakah penyimpangan antara jumlah yang diamati dan yang diharapkan terlalu besar untuk dikaitkan dengan kebetulan. Penyimpangan dari independensi mudah diperiksa dengan memeriksa residu (coba ?mosaicplotatau ?assocplot, tetapi juga lihat vcdpaket). Gunakan fisher.test()untuk tes yang tepat (mengandalkan distribusi hypergeometric).

The prop.test()fungsi dalam R memungkinkan untuk menguji apakah proporsi sebanding antara kelompok atau tidak berbeda dari probabilitas teoritis. Ini disebut sebagai -test karena statistik uji terlihat seperti ini:z

z=(f1f2)p^(1p^)(1n1+1n2)

di mana , dan indeks merujuk ke baris pertama dan kedua dari tabel Anda. Dalam tabel kontingensi dua arah di mana , ini akan menghasilkan hasil yang sebanding dengan tes biasa :p^=(p1+p2)/(n1+n2)H 0 :(1,2)χ 2H0:p1=p2χ2

> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476

> prop.test(tab)

    2-sample test for equality of proportions with continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.15834617  0.04723506 
sample estimates:
   prop 1    prop 2 
0.8333333 0.8888889 

Untuk analisis data diskrit dengan R, saya sangat merekomendasikan R (dan S-PLUS) Manual untuk Mendampingi Analisis Data Kategorikal Agresti (2002) , dari Laura Thompson.

chl
sumber
2
Apakah ada nama umum untuk pengujian yang dilakukan prop.test ()?
Atticus29
2
"Ini disebut sebagai z-test".
russellpierce
@ chl Saya agak bingung - saya pikir prop.testdan chisq.testkeduanya menggunakan chi-square, yang akan menjelaskan nilai p yang identik, serta mengapa dalam posting ini di R-Blogger mereka memiliki fungsi ad hoc mereka sendiri.
Antoni Parellada
@Antoni Ya, ini yang dijelaskan Keith dalam jawabannya.
chl
3
whats dan , , , , ? n 2 f 1 f 2 p 1 p 2n1n2f1f2p1p2
Tomka
23

Tes chi-square untuk kesetaraan dua proporsi adalah hal yang persis sama dengan uji- . Distribusi chi-squared dengan satu derajat kebebasan adalah hanya dari penyimpangan normal, kuadrat. Anda pada dasarnya hanya mengulangi uji chi-squared pada subset dari tabel kontingensi. (Inilah sebabnya @chl mendapatkan nilai- sama persis dengan kedua tes.)halzp

Masalah melakukan tes chi-squared secara global pertama dan kemudian menyelam untuk melakukan lebih banyak tes pada himpunan bagian adalah Anda tidak akan selalu mempertahankan alpha Anda - yaitu, Anda tidak akan mengontrol positif palsu menjadi kurang dari 5% (atau terserah ) di seluruh percobaan.α

Saya pikir jika Anda ingin melakukan ini dengan benar dalam paradigma klasik, Anda perlu mengidentifikasi hipotesis Anda di awal (yang sebanding dengan perbandingan), mengumpulkan data, dan kemudian menguji hipotesis sehingga total ambang batas untuk signifikansi setiap jumlah tes ke . Kecuali Anda dapat membuktikan apriori bahwa ada beberapa korelasi.α

Tes paling kuat untuk persamaan proporsi disebut tes Barnard untuk superioritas .

Keith Winstein
sumber
@ung aku agak bingung - saya pikir prop.testdan chisq.testkeduanya menggunakan chi-square, yang akan menjelaskan nilai p yang identik, serta mengapa dalam posting ini di R-Blogger mereka memiliki fungsi ad hoc mereka sendiri.
Antoni Parellada
Saya tidak mengerti apa yang membingungkan Anda, @AntoniParellada. Jawaban ini menyatakan bahwa mereka "persis sama", yang masuk akal jika "keduanya menggunakan chi-square".
gung - Reinstate Monica
@gung dalam jawaban asli chl menyatakan bahwa prop.test()... disebut sebagai uji-z yang bertentangan dengan chisq.test(). Belakangan Keith berkata, "Tes chi-square untuk kesetaraan dua proporsi adalah hal yang persis sama dengan uji-z. (Inilah sebabnya @chl mendapatkan nilai p yang sama persis dengan kedua tes.)"
Antoni Parellada
1
Tampaknya itu hanya ungkapan yang tidak sopan, @AntoniParellada. Secara konseptual, 2 tes berbeda, yang saya bahas dalam jawaban saya yang lain yang Anda lihat. Namun secara matematis, mereka setara. Bahkan, saya percaya fungsi R prop.test()sebenarnya hanya memanggil chisq.test()& mencetak output secara berbeda.
gung - Reinstate Monica
@gung Saya telah mengerjakan fungsi yang mirip dengan R-Blogger dan saya akan membuat posting untuk orang-orang di tingkat pemula saya, mengutip Anda sebenarnya mengenai beberapa konsep kunci yang telah Anda tulis, menjalankan matematika baik untuk chi kuadrat dan uji-z, dan kemudian memberikan kode R.
Antoni Parellada