Setelah beberapa diskusi (di bawah), saya sekarang memiliki gambaran yang lebih jelas tentang pertanyaan terfokus, jadi di sini adalah pertanyaan yang direvisi, meskipun beberapa komentar sekarang mungkin tampaknya tidak berhubungan dengan pertanyaan awal.
Tampaknya uji-t menyatu dengan cepat untuk distribusi simetris , bahwa tes peringkat-bertanda mengasumsikan simetri , dan bahwa, untuk distribusi simetris, tidak ada perbedaan antara mean / pseudomedian / median. Jika demikian, dalam keadaan apa seorang ahli statistik yang relatif tidak berpengalaman menganggap tes peringkat-bertanda berguna, ketika ia memiliki tes-t dan tes masuk? Jika salah satu siswa saya (misalnya ilmu sosial) mencoba untuk menguji apakah satu perlakuan berkinerja lebih baik daripada yang lain (dengan ukuran yang relatif mudah ditafsirkan, misalnya beberapa gagasan tentang perbedaan "rata-rata"), saya berjuang untuk menemukan tempat untuk menandatangani tes peringkat, meskipun tampaknya secara umum diajarkan, dan tes tanda diabaikan, di universitas saya.
Jawaban:
Pertimbangkan distribusi perbedaan pasangan yang agak lebih berat dari biasanya, tetapi tidak terlalu "berpuncak"; maka seringkali tes peringkat yang ditandatangani cenderung lebih kuat daripada uji-t, tetapi juga lebih kuat daripada tes tanda.
Sebagai contoh, pada distribusi logistik, efisiensi relatif asimptotik dari uji peringkat yang ditandatangani relatif terhadap uji-t adalah 1,097 sehingga uji peringkat yang ditandatangani harus lebih kuat daripada t (setidaknya dalam sampel yang lebih besar), tetapi efisiensi relatif asimptotik uji tanda relatif terhadap uji-t adalah 0,822, sehingga uji tanda akan lebih kuat daripada uji t (sekali lagi, setidaknya dalam sampel yang lebih besar).
Ketika kita pindah ke distribusi ekor yang lebih berat (sambil tetap menghindari yang terlalu berpuncak), t akan cenderung berkinerja relatif lebih buruk, sementara uji-tanda akan meningkat sedikit, dan kedua tanda dan peringkat yang ditandatangani akan mengungguli t dalam mendeteksi kecil efek dengan margin substansial (yaitu akan membutuhkan ukuran sampel yang jauh lebih kecil untuk mendeteksi efek). Akan ada kelas besar distribusi di mana tes peringkat bertanda adalah yang terbaik dari ketiganya.
Seperti yang kita lihat di plot, tes peringkat yang ditandatangani memiliki kekuatan lebih dari tes tanda, yang pada gilirannya memiliki kekuatan lebih dari uji-t.
sumber