Misalkan saya memiliki tiga populasi dengan empat, karakteristik yang saling eksklusif. Saya mengambil sampel acak dari setiap populasi dan membuat tabel tab silang atau frekuensi untuk karakteristik yang saya ukur. Apakah saya benar mengatakan bahwa:
Jika saya ingin menguji apakah ada hubungan antara populasi dan karakteristik (misalnya apakah satu populasi memiliki frekuensi lebih tinggi dari salah satu karakteristik), saya harus menjalankan uji chi-squared dan melihat apakah hasilnya signifikan.
Jika uji chi-kuadrat signifikan, itu hanya menunjukkan kepada saya bahwa ada beberapa hubungan antara populasi dan karakteristik, tetapi tidak bagaimana mereka terkait.
Selain itu, tidak semua karakteristik perlu dikaitkan dengan populasi. Misalnya, jika populasi yang berbeda memiliki distribusi karakteristik A dan B yang berbeda secara signifikan, tetapi tidak dengan C dan D, maka uji chi-kuadrat masih mungkin kembali signifikan.
Jika saya ingin mengukur apakah karakteristik tertentu dipengaruhi oleh populasi atau tidak, maka saya dapat menjalankan tes untuk proporsi yang sama (saya telah melihat ini disebut uji-z, atau seperti
prop.test()
padaR
) hanya pada karakteristik itu.
Dengan kata lain, apakah pantas untuk menggunakan prop.test()
untuk lebih akurat menentukan sifat hubungan antara dua set kategori ketika uji chi-square mengatakan bahwa ada hubungan yang signifikan?
Jawaban:
Jawaban yang sangat singkat:
Uji chi-Squared (
chisq.test()
dalam R) membandingkan frekuensi yang diamati dalam setiap kategori tabel kontingensi dengan frekuensi yang diharapkan (dihitung sebagai produk dari frekuensi marginal). Ini digunakan untuk menentukan apakah penyimpangan antara jumlah yang diamati dan yang diharapkan terlalu besar untuk dikaitkan dengan kebetulan. Penyimpangan dari independensi mudah diperiksa dengan memeriksa residu (coba?mosaicplot
atau?assocplot
, tetapi juga lihatvcd
paket). Gunakanfisher.test()
untuk tes yang tepat (mengandalkan distribusi hypergeometric).Thez
prop.test()
fungsi dalam R memungkinkan untuk menguji apakah proporsi sebanding antara kelompok atau tidak berbeda dari probabilitas teoritis. Ini disebut sebagai -test karena statistik uji terlihat seperti ini:di mana , dan indeks merujuk ke baris pertama dan kedua dari tabel Anda. Dalam tabel kontingensi dua arah di mana , ini akan menghasilkan hasil yang sebanding dengan tes biasa :p^=(p1+p2)/(n1+n2) H 0 :(1,2) χ 2H0:p1=p2 χ2
Untuk analisis data diskrit dengan R, saya sangat merekomendasikan R (dan S-PLUS) Manual untuk Mendampingi Analisis Data Kategorikal Agresti (2002) , dari Laura Thompson.
sumber
prop.test
danchisq.test
keduanya menggunakan chi-square, yang akan menjelaskan nilai p yang identik, serta mengapa dalam posting ini di R-Blogger mereka memiliki fungsi ad hoc mereka sendiri.Tes chi-square untuk kesetaraan dua proporsi adalah hal yang persis sama dengan uji- . Distribusi chi-squared dengan satu derajat kebebasan adalah hanya dari penyimpangan normal, kuadrat. Anda pada dasarnya hanya mengulangi uji chi-squared pada subset dari tabel kontingensi. (Inilah sebabnya @chl mendapatkan nilai- sama persis dengan kedua tes.)halz p
Masalah melakukan tes chi-squared secara global pertama dan kemudian menyelam untuk melakukan lebih banyak tes pada himpunan bagian adalah Anda tidak akan selalu mempertahankan alpha Anda - yaitu, Anda tidak akan mengontrol positif palsu menjadi kurang dari 5% (atau terserah ) di seluruh percobaan.α
Saya pikir jika Anda ingin melakukan ini dengan benar dalam paradigma klasik, Anda perlu mengidentifikasi hipotesis Anda di awal (yang sebanding dengan perbandingan), mengumpulkan data, dan kemudian menguji hipotesis sehingga total ambang batas untuk signifikansi setiap jumlah tes ke . Kecuali Anda dapat membuktikan apriori bahwa ada beberapa korelasi.α
Tes paling kuat untuk persamaan proporsi disebut tes Barnard untuk superioritas .
sumber
prop.test
danchisq.test
keduanya menggunakan chi-square, yang akan menjelaskan nilai p yang identik, serta mengapa dalam posting ini di R-Blogger mereka memiliki fungsi ad hoc mereka sendiri.prop.test()
... disebut sebagai uji-z yang bertentangan denganchisq.test()
. Belakangan Keith berkata, "Tes chi-square untuk kesetaraan dua proporsi adalah hal yang persis sama dengan uji-z. (Inilah sebabnya @chl mendapatkan nilai p yang sama persis dengan kedua tes.)"prop.test()
sebenarnya hanya memanggilchisq.test()
& mencetak output secara berbeda.