Teks nonparametrik saya, Praktis Statistik Nonparametrik , sering memberikan rumus yang bersih untuk harapan, varian, statistik uji, dan sejenisnya, tetapi termasuk peringatan bahwa ini hanya berfungsi jika kita mengabaikan ikatan. Saat menghitung Statistik Mann-Whitney U, Anda disarankan untuk membuang pasangan terikat ketika membandingkan mana yang lebih besar.
Saya mendapatkan bahwa ikatan tidak benar-benar memberi tahu kita banyak tentang populasi yang lebih besar (jika itu yang kita minati) karena tidak ada kelompok yang lebih besar dari yang lain, tetapi tampaknya tidak masalah ketika mengembangkan distribusi asimptotik.
Lalu mengapa ini menjadi masalah yang berhubungan dengan ikatan dalam beberapa prosedur nonparametrik? Apakah ada cara untuk mengekstraksi informasi yang berguna dari ikatan, daripada hanya membuangnya?
EDIT: Sehubungan dengan komentar @ whuber, saya memeriksa sumber saya lagi, dan beberapa prosedur menggunakan rata-rata peringkat alih-alih menjatuhkan nilai yang diikat sepenuhnya. Meskipun ini tampaknya lebih masuk akal dalam hal mempertahankan informasi, bagi saya tampaknya juga kurang tepat. Namun, semangat pertanyaan tetap ada.
sumber
Jawaban:
Sebagian besar pekerjaan pada non-parametrik awalnya dilakukan dengan asumsi bahwa ada distribusi berkelanjutan yang mendasarinya di mana ikatan tidak mungkin (jika diukur cukup akurat). Teori ini kemudian dapat didasarkan pada distribusi statistik pesanan (yang jauh lebih sederhana tanpa ikatan) atau formula lainnya. Dalam beberapa kasus, statistik berjalan mendekati normal yang membuat semuanya menjadi sangat mudah. Ketika ikatan diperkenalkan karena data dibulatkan atau secara alami diskrit, maka asumsi standar tidak berlaku. Perkiraan mungkin masih cukup baik dalam beberapa kasus, tetapi tidak dalam kasus lain, sehingga seringkali hal yang paling mudah untuk dilakukan adalah hanya memberi peringatan bahwa formula ini tidak bekerja dengan ikatan.
Ada alat untuk beberapa tes non-parametrik standar yang telah menentukan distribusi yang tepat ketika ada ikatan. Paket exactRankTests untuk R adalah salah satu contoh.
Salah satu cara sederhana untuk menangani ikatan adalah dengan menggunakan tes pengacakan seperti tes permutasi atau bootstrap. Ini tidak khawatir tentang distribusi asimptotik, tetapi gunakan data apa adanya, ikatan dan semua (perhatikan bahwa dengan banyak ikatan, bahkan teknik ini mungkin memiliki daya rendah).
Ada sebuah artikel beberapa tahun yang lalu (saya pikir dalam Ahli Statistik Amerika, tetapi saya tidak menemukannya) yang membahas ide-ide ikatan dan beberapa hal yang dapat Anda lakukan dengan mereka. Satu hal adalah bahwa itu tergantung pada pertanyaan apa yang Anda tanyakan, apa yang harus dilakukan dengan ikatan bisa sangat berbeda dalam tes superioritas vs tes non-inferioritas.
sumber