Saya membandingkan sampel dan memeriksa apakah itu terdistribusi sebagai beberapa, diskrit, distribusi. Namun, saya tidak yakin bahwa Kolmogorov-Smirnov berlaku. Wikipedia tampaknya menyiratkan tidak. Jika tidak, bagaimana saya bisa menguji distribusi sampel?
29
Jawaban:
Itu tidak berlaku untuk distribusi diskrit. Lihat http://www.itl.nist.gov/div898/handbook/eda/section3/eda35g.htm misalnya.
Apakah ada alasan Anda tidak dapat menggunakan uji kelayakan chi-square? lihat http://www.itl.nist.gov/div898/handbook/eda/section3/eda35f.htm untuk info lebih lanjut.
sumber
Seperti yang sering terjadi dalam statistik, itu tergantung pada apa yang Anda maksudkan .
Jika Anda bermaksud "Saya menghitung statistik pengujian saya pada sampel yang diambil dari distribusi diskrit dan kemudian mencari tabel standar" maka Anda akan mendapatkan tingkat kesalahan tipe I yang benar lebih rendah daripada yang Anda pilih (mungkin jauh lebih rendah).
Berapa banyak tergantung pada "seberapa terpisah" distribusinya. Jika probabilitas salah satu hasil cukup rendah (sehingga proporsi nilai terikat dalam data akan diharapkan rendah) maka itu tidak masalah banyak - banyak orang tidak akan memiliki masalah dengan menjalankan 5 % tes 4,5% mengatakan. Jadi misalnya, jika Anda menguji seragam diskrit pada [1.100], Anda mungkin tidak perlu khawatir.
Tetapi jika ada probabilitas tinggi dari nilai yang diikat, maka efek pada tingkat kesalahan tipe I dapat ditandai. Jika Anda mendapatkan tingkat signifikansi 0,005 ketika Anda ingin 0,05, itu mungkin menjadi masalah, karena itu akan berdampak pada daya.
Jika sebaliknya, Anda bermaksud "Saya menghitung statistik pengujian saya pada sampel yang diambil dari distribusi diskrit dan kemudian menggunakan nilai kritis yang sesuai / menghitung nilai p yang sesuai untuk situasi saya" (misalnya, melalui tes permutasi, misalnya), kemudian tes tentu saja valid dalam arti bahwa Anda akan mendapatkan tingkat kesalahan tipe I yang tepat - hingga ke diskresi statistik tes itu sendiri, tentu saja. (Meskipun mungkin ada tes yang lebih baik untuk tujuan khusus Anda, sama seperti biasanya ada dalam kasus berkelanjutan.)
Perhatikan bahwa distribusi uji statistik itu sendiri tidak lagi bebas distribusi tetapi uji permutasi menghindari masalah itu.
Jadi kadang-kadang tidak apa-apa untuk menggunakan tabel standar bahkan dengan distribusi diskrit, dan bahkan ketika itu tidak apa-apa, itu tidak begitu banyak statistik uji sebagai nilai kritis / p-nilai yang Anda gunakan dengan itu yang menjadi masalah.
sumber
sumber