Setelah pemungutan suara baru-baru ini saya telah mencoba untuk memeriksa pemahaman saya tentang tes Pearson Chi Squared. Saya biasanya menggunakan statistik chi kuadrat (atau statistik chi kuadrat berkurang) untuk pas atau memeriksa cocok yang dihasilkan. Dalam hal ini varians biasanya bukan jumlah yang diharapkan dari hitungan dalam tabel atau histogram tetapi beberapa varians ditentukan secara eksperimental. Either way, saya selalu mendapat kesan bahwa tes masih menggunakan normalitas asimptotik dari multinomial PDF (yaitu statistik pengujian saya adalah
dan adalah asimtotik multinormal di mana adalah matriks kovarians). Oleh karena itu memiliki distribusi chi-kuadrat yang diberikan besar sehingga menggunakan jumlah penghitungan yang diharapkan sebagai penyebut dalam statistik menjadi valid untuk besar . Mungkin ini hanya berlaku untuk histogram, saya belum menganalisis tabel kecil data selama bertahun-tahun.V Q n n
Apakah ada argumen yang lebih halus yang saya lewatkan? Saya akan tertarik pada referensi, atau lebih baik penjelasan singkat. (Meskipun mungkin saya baru saja memilih untuk menghilangkan kata asimptotik, yang saya akui agak penting.)
sumber
Jawaban:
Tes Chi-square dirancang untuk menganalisis data kategorikal. Itu berarti bahwa data telah dihitung dan dibagi menjadi beberapa kategori. Ini tidak akan bekerja dengan data parametrik atau kontinu. Jadi itu tidak bekerja untuk menentukan kecocokan yang dihasilkan dalam setiap contoh.
Sumber: http://www.ling.upenn.edu/~clight/chisquared.htm
sumber