Pertanyaan seorang pemula tentang residu Pearson dalam konteks uji chi-square untuk kebaikan:
Serta statistik uji, R's chisq.test
fungsi melaporkan residu Pearson:
(obs - exp) / sqrt(exp)
Saya mengerti mengapa melihat perbedaan mentah antara nilai yang diamati dan yang diharapkan tidak informatif, karena sampel yang lebih kecil akan menghasilkan perbedaan yang lebih kecil. Namun, saya ingin tahu lebih banyak tentang efek penyebut: mengapa membagi dengan akar dari nilai yang diharapkan? Apakah ini residu 'standar'?
chi-squared
goodness-of-fit
residuals
Iain Dillingham
sumber
sumber
stdres
untuk residu standar.chisq.test
juga menghitungstdres
komponen?Jawaban:
Jadi, apa yang Anda lihat dalam rumus yang Anda tanyakan adalah jumlah sel terstandarisasi, dengan asumsi bahwa jumlah sel memiliki distribusi Poisson (tanpa syarat).
Dari sini adalah umum untuk menguji independensi variabel baris dan kolom dalam data, dan dalam hal ini Anda dapat menggunakan statistik uji yang terlihat pada jumlah kuadrat dari nilai-nilai di atas (yang setara dengan norma kuadrat) dari vektor nilai standar). Uji chi-squared memberikan nilai-p untuk jenis tes ini berdasarkan pada perkiraan sampel besar untuk distribusi nol dari statistik uji. Ini biasanya diterapkan dalam kasus di mana tidak ada jumlah penjualan yang terlalu kecil.
sumber
Dalam konteks goodness of fit, Anda dapat merujuk ke http://www.stat.yale.edu/Courses/1997-98/101/chigf.htm ini .
Jika Anda ingin tahu bagaimana penyebutnya sampai di sana, Anda harus melihat chi-squared di sini sebagai perkiraan normal untuk binomial, sebagai permulaan, yang kemudian dapat diperluas ke multinomial.
sumber