Apakah boleh menggunakan uji good-of-fit Kolmogorov-Smirnov untuk membandingkan dua distribusi empiris untuk menentukan apakah mereka tampaknya berasal dari distribusi dasar yang sama, daripada membandingkan satu distribusi empiris ke distribusi referensi yang ditentukan sebelumnya?
Biarkan saya mencoba bertanya dengan cara lain. Saya mengumpulkan N sampel dari beberapa distribusi di satu lokasi. Saya mengumpulkan sampel M di lokasi lain. Data kontinu (setiap sampel adalah bilangan real antara 0 dan 10, katakanlah) tetapi tidak terdistribusi secara normal. Saya ingin menguji apakah semua sampel N + M ini berasal dari distribusi dasar yang sama. Apakah masuk akal untuk menggunakan tes Kolmogorov-Smirnov untuk tujuan ini?
(Saya membaca di tempat lain bahwa tes Kolmogorov-Smirnov untuk kebaikan tidak cocok untuk distribusi diskrit , tetapi saya akui saya tidak mengerti apa artinya ini atau mengapa itu mungkin benar. Apakah itu berarti pendekatan yang saya usulkan adalah yang buruk? )
Atau, apakah Anda merekomendasikan yang lain?
Jawaban:
Tidak apa-apa, dan cukup masuk akal. Ini disebut sebagai uji Kolmogorov-Smirnov dua sampel . Mengukur perbedaan antara dua fungsi distribusi oleh supnorm selalu masuk akal, tetapi untuk melakukan tes formal Anda ingin mengetahui distribusi di bawah hipotesis bahwa dua sampel independen dan masing-masing dari distribusi dasar yang sama. Untuk bergantung pada teori asimptotik yang biasa, Anda akan memerlukan kontinuitas dari distribusi umum yang mendasarinya (bukan dari distribusi empiris). Lihat halaman Wikipedia yang tertaut di atas untuk detail lebih lanjut.
ks.test
sumber