Dalam situasi apa Wilcoxon Signed-Rank Test lebih disukai daripada t-Test atau Sign Test?

10

Setelah beberapa diskusi (di bawah), saya sekarang memiliki gambaran yang lebih jelas tentang pertanyaan terfokus, jadi di sini adalah pertanyaan yang direvisi, meskipun beberapa komentar sekarang mungkin tampaknya tidak berhubungan dengan pertanyaan awal.

Tampaknya uji-t menyatu dengan cepat untuk distribusi simetris , bahwa tes peringkat-bertanda mengasumsikan simetri , dan bahwa, untuk distribusi simetris, tidak ada perbedaan antara mean / pseudomedian / median. Jika demikian, dalam keadaan apa seorang ahli statistik yang relatif tidak berpengalaman menganggap tes peringkat-bertanda berguna, ketika ia memiliki tes-t dan tes masuk? Jika salah satu siswa saya (misalnya ilmu sosial) mencoba untuk menguji apakah satu perlakuan berkinerja lebih baik daripada yang lain (dengan ukuran yang relatif mudah ditafsirkan, misalnya beberapa gagasan tentang perbedaan "rata-rata"), saya berjuang untuk menemukan tempat untuk menandatangani tes peringkat, meskipun tampaknya secara umum diajarkan, dan tes tanda diabaikan, di universitas saya.

hanya aku
sumber
1
Justme: tentu saja, saya tidak memikirkan hal itu.
JonB
1
Itu tergantung pada kebijaksanaan konvensional siapa yang Anda lihat; pengalaman saya sangat berbeda dengan Anda. Tentu saja mudah untuk menemukan sumber daya yang secara jelas menyatakan bahwa simetri skor perbedaan diasumsikan di bawah nol (dan itu penting). Tetapi perhatikan bahwa ini berada di bawah nol - sebagai hasilnya, menemukan kurangnya simetri dalam skor perbedaan dalam sampel tidak selalu relevan - Anda tidak diharuskan memiliki simetri di bawah alternatif. Jika Anda sangat yakin bahwa jika nol itu benar, simetri akan berlaku - dan dalam banyak kasus itu adalah asumsi yang sangat masuk akal - ...
ctd
1
ctd ... maka tidak ada masalah. Masalahnya adalah, jika Anda tidak siap untuk menganggapnya sebelumnya, Anda tidak tahu apakah penolakan disebabkan oleh kegagalan asumsi; hal yang jelas untuk dilakukan adalah tidak menganggapnya.
Glen_b -Reinstate Monica
2
Melihat komentar kedua Anda terlebih dahulu: (di atas apa yang telah Anda sebutkan), perhatikan bahwa 1. asumsi normal tidak menghabiskan tes parametrik. 2. Tes peringkat yang ditandatangani sebenarnya bukan tes median tetapi dari satu sampel Hodges-Lehmann statistik / pseudomedian (meskipun jika Anda menambahkan asumsi simetri ke alternatif, itu juga akan menguji median, dan di mana ada sarana, juga untuk sarana, di antara banyak hal lainnya). Demikian pula tes peringkat jumlah bukanlah tes median tetapi perbedaan median berpasangan. Anda benar bahwa tingkat tes peringkat yang ditandatangani bisa sangat sensitif terhadap asimetri.
Glen_b -Reinstate Monica
2
Pada komentar Anda sebelumnya: 1 Simetri umumnya tidak dilihat sebagai bagian dari nol, tetapi sebagai bagian dari asumsi yang Anda butuhkan agar permutasi dapat ditukar dengan nol. 2. seperti yang disebutkan sebelumnya, ini sebenarnya bukan tes median, tetapi pseudomedian, dan ini berlaku bahkan di bawah alternatif asimetris. Memang benar bahwa interpretasi kadang-kadang lebih mudah jika Anda membuat beberapa asumsi yang membatasi, tetapi pembatasan yang diperlukan untuk membuatnya menjadi tes yang masuk akal untuk median tidak harus seketat asumsi asumsi simetri di bawah alternatif.
Glen_b -Reinstate Monica

Jawaban:

3

Pertimbangkan distribusi perbedaan pasangan yang agak lebih berat dari biasanya, tetapi tidak terlalu "berpuncak"; maka seringkali tes peringkat yang ditandatangani cenderung lebih kuat daripada uji-t, tetapi juga lebih kuat daripada tes tanda.

Sebagai contoh, pada distribusi logistik, efisiensi relatif asimptotik dari uji peringkat yang ditandatangani relatif terhadap uji-t adalah 1,097 sehingga uji peringkat yang ditandatangani harus lebih kuat daripada t (setidaknya dalam sampel yang lebih besar), tetapi efisiensi relatif asimptotik uji tanda relatif terhadap uji-t adalah 0,822, sehingga uji tanda akan lebih kuat daripada uji t (sekali lagi, setidaknya dalam sampel yang lebih besar).

Ketika kita pindah ke distribusi ekor yang lebih berat (sambil tetap menghindari yang terlalu berpuncak), t akan cenderung berkinerja relatif lebih buruk, sementara uji-tanda akan meningkat sedikit, dan kedua tanda dan peringkat yang ditandatangani akan mengungguli t dalam mendeteksi kecil efek dengan margin substansial (yaitu akan membutuhkan ukuran sampel yang jauh lebih kecil untuk mendeteksi efek). Akan ada kelas besar distribusi di mana tes peringkat bertanda adalah yang terbaik dari ketiganya.

t3tδ

plot kurva daya untuk t, Wilcoxon menandatangani tes peringkat dan tanda dengan n = 100 dan tingkat signifikansi 5% untuk t3

Seperti yang kita lihat di plot, tes peringkat yang ditandatangani memiliki kekuatan lebih dari tes tanda, yang pada gilirannya memiliki kekuatan lebih dari uji-t.

Glen_b -Reinstate Monica
sumber
Terima kasih banyak untuk @Glen_b ini! Saya masih berjuang untuk mencari tahu di mana itu sesuai dengan silabus kami, ketika kami memiliki siswa yang bahkan konsep kekuasaannya berada di luar ruang lingkup studi mereka, dan mengapa kami mengajar Wilcoxon sebagai alternatif utama untuk pasangan t. Tetapi ini memang memberikan beberapa motivasi yang bermanfaat. Terima kasih!
justme
Kebetulan setelah mempertimbangkan fitur distribusi apa yang memengaruhi varians asimptotik median (dan karenanya kekuatan uji tanda), sebuah contoh terjadi pada saya di mana posisi relatif uji t dan uji tanda dibalik; sebagai hasilnya saya pikir ada kemungkinan yang baik untuk membangun sebuah kasus di mana tes peringkat yang ditandatangani mungkin jauh lebih baik daripada salah satu dari dua tes lainnya. Saya akan bermain dengannya lagi ketika saya bisa dan mungkin menulis sesuatu di atasnya.
Glen_b -Reinstate Monica
Sejauh silabus Anda berjalan, jelas ada kasus-kasus di mana peringkat yang ditandatangani mengungguli kedua tes lainnya (seperti yang saya jelaskan dalam jawaban saya - distribusi yang agak lebih berat dari biasanya, tetapi tidak terutama memuncak); t lebih baik pada normal atau lebih ringan, dan uji tanda lebih baik ketika distribusinya memiliki puncak yang kuat (yang sering cenderung sejalan dengan ekor yang sangat berat, tetapi tidak harus). [Namun berhati-hatilah, mengacaukan ide-ide ini hanya dengan perubahan dalam penyebaran, yang tidak mengubah sifat relatif mereka.] ... Saya yakin Anda dapat menekan beberapa kalimat seperti itu di
Glen_b -Reinstate Monica
Terima kasih banyak @Glen_b! Masalahnya adalah saya tidak mengajar silabus, hanya mendukungnya! Silabus di sebagian besar departemen tampaknya adalah: (i) menggunakan uji hipotesis normalitas (bunuh saya sekarang) dan berdasarkan itu (ii) gunakan Wilcoxon atau t-Test. Jadi detail yang lebih baik dari bahu distribusi dll bahkan tidak pernah disentuh, dan juga tidak ada kekuatan, hanya apakah asumsi dipenuhi (dengan cara yang sedikit sampah). Tetapi pikiran Anda sangat membantu saya secara pribadi, setidaknya!
justme
Pos hebat @Glen_b! Jadi dalam hal memilih dari dua tes, dapatkah saya menyimpulkan bahwa kita harus selalu menghitung daya terlebih dahulu? Alih-alih mengikuti asumsi yang selalu menggunakan Uji Tanda jika perbedaan distribusi tidak normal? Terima kasih!
Lumos