Uji permutasi dua sampel Kolmogorov-Smirnov

8

Meskipun lebih mudah menggunakan uji tipe Pearson chi-square / Cressie-Read, saya ingin menguji kesetaraan proporsi dalam kkategori di dua kelompok menggunakan uji tipe Kolmogorov-Smirnov dari formulir yang diusulkan oleh Pettitt & Stephens (1977) (lihat juga di sini ).

Khususnya seperti yang ditunjukkan oleh penulis makalah itu, ia mungkin memiliki kekuatan terhadap alternatif yang sedang tren. Jadi, uji Kolmogorov-Smirnov nominal / sampel satu sampel mereka memiliki bentuk:

Dn=supπsup1jk|i=1j(fexp,π(i)fobs,π(i))|
di mana π adalah permutasi dari urutan kategori, f.,i adalah frekuensi yang diamati dan diharapkan (atau setara, proporsi pengamatan) dalam kategori i . Ini dapat ditulis secara ekivalen sebagai:
Dn=12i=1k|fexp,ifobs,i|
Saya ingin memperpanjang ini untuk case dua sampel menggunakan prosedur pengacakan / permutasi, seperti:
Dn(r)=12i=1k|fgroup1,i(r)fgroup2,i(r)|,r=1,,R
where .(r) menunjukkan statistik dihitung berdasarkan rthpermutasi dari variabel kategori. Tolak jika nilai statistik asli lebih besar dari nilai 95% dari statistik yang diizinkan.

Setiap komentar tentang pro / kontra / validitas dari prosedur semacam itu sangat disambut baik. Terima kasih.

blueberry
sumber

Jawaban:

3

Jawabannya tergantung pada sifat proses pembuatan data dan pada hipotesis alternatif yang ada dalam pikiran Anda.

Tes Anda adalah sejenis chi-square tanpa bobot. Karena kurangnya bobot ini, perubahan yang terutama mempengaruhi kategori kurang populasi akan sulit dideteksi. Sebagai contoh, pengujian Anda akan menjadi jauh kurang kuat daripada uji chi-square untuk pergeseran seragam di lokasi, yang dideteksi terutama dengan memperhatikan bahwa hampir semua probabilitas dalam satu ekor akan bergeser ke ekor lainnya.

Sebagai contoh, anggaplah kategori Anda adalah bilangan bulat diindeks oleh dan Anda mengamati varian normal varian unit tetapi rata-rata tidak diketahui. 100 pengamatan dari varian normal standar, katakanlah, terutama akan menempati kategori hingga , meskipun Anda dapat mengharapkan beberapa untuk menempati kategori dan . Bahkan untuk pergeseran besar dari kesalahan standar ( yaitu , perubahan rata-rata ), kekuatan tes mirip KD Anda hanya sekitar 50% (ketika ).[i,i+1)i213255/100=0.5α=0.05

Sulit untuk membayangkan pengaturan di mana tes ini akan lebih kuat daripada tes chi-square. Jika Anda merasa berada dalam situasi seperti itu, lakukan beberapa simulasi untuk mengetahui apa daya tersebut dan bagaimana perbandingannya dengan tes alternatif standar.

whuber
sumber
jika saya mengerti benar apa yang Anda tulis, bukankah akan sama untuk semua ? juga - saya bisa melihat bagaimana cara mendapatkan nilai kritis estimasi monte-carlo untuk ; tetapi bagaimana dengan untuk ? Dn(r)rDnDn(r)
ronaf
@ronaf Bisakah Anda memberikan detail lebih lanjut tentang ? Apa itu R? Saya tidak melihat bahwa permutasi kategori tidak melakukan apa-apa sama sekali: perhatikan bahwa tidak ada permutasi yang akan mengubah jumlah perbedaan absolut dari jumlah mereka. Dn(r)
whuber