Apakah output statistik W oleh wilcox.test () dalam R sama dengan statistik U?

22

Saya baru-baru ini membaca tentang tes Mann-Whitney U. Ternyata untuk melakukan tes ini di R Anda benar-benar perlu menjalankan tes Wilcoxon!

Pertanyaan saya: apakah statistik W wilcox.testdi R identik dengan statistik U?

luciano
sumber

Jawaban:

25

Wilcoxon umumnya dianggap sebagai penemu asli tes *, meskipun pendekatan Mann dan Whitney adalah langkah maju yang baik, dan mereka memperpanjang kasus-kasus di mana statistik ditabulasikan. Preferensi saya adalah merujuk pada tes sebagai Wilcoxon-Mann-Whitney, untuk mengenali kedua kontribusi (Mann-Whitney-Wilcoxon juga terlihat; Saya juga tidak keberatan).

* Namun, gambaran sebenarnya sedikit lebih keruh, dengan beberapa penulis lain juga datang dengan statistik yang sama atau serupa tentang waktu ini atau sebelumnya, atau dalam beberapa kasus memberikan kontribusi yang terkait erat dengan tes. Setidaknya sebagian kredit harus pergi ke tempat lain.

Tes Wilcoxon dan tes Mann-Whitney U adalah setara (dan bantuan menyatakan bahwa mereka) dalam arti bahwa mereka selalu menolak kasus yang sama dalam keadaan yang sama; paling banyak statistik pengujian mereka hanya akan berbeda dengan pergeseran (dan dalam beberapa kasus, mungkin saja perubahan tanda).

Tes Wilcoxon didefinisikan dalam lebih dari satu cara dalam literatur (dan bahwa ambiguitas kembali ke tabulasi asli dari statistik tes, lebih dari satu saat), sehingga orang harus berhati-hati dengan yang mana tes Wilcoxon sedang dibahas.

Dua bentuk definisi yang paling umum dibahas dalam pasangan posting ini:

Tes jumlah peringkat Wilcoxon dalam R

Berbagai cara untuk menghitung statistik uji untuk tes jumlah peringkat Wilcoxon

Untuk mengatasi apa, khususnya, yang terjadi di R:

Statistik yang digunakan oleh wilcox.testdalam R didefinisikan dalam bantuan ( ?wilcox.test), dan pertanyaan tentang hubungan dengan statistik Mann-Whitney U dijelaskan di sana:

Literatur tidak sepakat tentang definisi jumlah peringkat Wilcoxon dan tes Mann-Whitney

Dua definisi paling umum berhubungan dengan jumlah peringkat sampel pertama dengan nilai minimum dikurangi atau tidak: R kurangi dan S-PLUS tidak, memberikan nilai yang lebih besar dengan m (m + 1) / 2 untuk sampel pertama ukuran m. (Tampaknya kertas asli Wilcoxon menggunakan jumlah peringkat yang tidak disesuaikan tetapi tabel berikutnya mengurangi minimum.)

Nilai R juga dapat dihitung sebagai jumlah semua pasangan (x[i], y[j])yang y[j]tidak lebih besar dari x[i], definisi paling umum dari uji Mann-Whitney.

Kalimat terakhir ini sepenuhnya menjawab aspek pertanyaan Anda - versi W yang dikeluarkan R * juga nilai U.

* Jumlah peringkat dalam sampel 1, minus nilai terkecil yang dapat diambilnya (yaitu minus ).n1(n1+1)2

Glen_b -Reinstate Monica
sumber
7

Baik uji jumlah Wilcoxon dan uji Mann-Whitney adalah ekuivalen non-parametrik dari uji-t independen . Dalam beberapa kasus, versi W yang R berikan, juga merupakan valua dari U. Tetapi tidak dalam semua kasus.

Saat Anda menggunakan: wilcox.test(df$var1 ~ df$var2, paired=FALSE)W yang diberikan sama dengan U. Jadi, Anda dapat melaporkannya sebagai statistik Mann-Whitney U.

Namun ketika Anda menggunakan wilcox.test(df$var1 ~ df$var2, paired=TRUE):, Anda benar-benar melakukan tes peringkat bertanda Wilcoxon. Tes peringkat yang ditandatangani Wilcoxon setara dengan uji-t dependen .

Sumber: "Dicovering statistics menggunakan R" oleh Andy Field (2013)

Jaap
sumber
1
Ide yang bagus untuk menunjukkan bahwa jika Anda menggunakan argumen paired=TRUEitu bukan Wilcoxon-Mann-Whitney tetapi peringkat yang ditandatangani.
Glen_b -Reinstate Monica
1

Perhatikan bahwa kode: wilcox.test(df$var1 ~ df$var2, paired=FALSE)(menggunakan '~')

akan menghasilkan statistik W yang berbeda dari yang: wilcox.test(df$var1, df$var2, paired=FALSE)(menggunakan ',')

Tilen
sumber
Selamat datang di situs ini, @Tilen. Apakah ini dimaksudkan sebagai jawaban untuk pertanyaan OP, komentar yang meminta klarifikasi dari OP atau salah satu penjawab, atau pertanyaan baru Anda sendiri? Harap hanya menggunakan bidang "Jawaban Anda" untuk memberikan jawaban atas pertanyaan awal. Anda akan dapat berkomentar di mana saja ketika reputasi Anda> 50. Jika Anda memiliki pertanyaan baru, klik abu-abu ASK QUESTION di bagian atas halaman & tanyakan di sana, maka kami dapat membantu Anda dengan baik. Karena Anda baru di sini, Anda mungkin ingin mengikuti tur kami , yang memiliki informasi untuk pengguna baru.
gung - Reinstate Monica
Banyak terima kasih @ung. Memang, itu semacam jawaban dan pertanyaan yang kurasa. Terima kasih untuk tipsnya. Saya berharap menjadi bagian dari ini.
Tilen
'Jawaban' hanya untuk jawaban langsung ke pertanyaan. Bisakah Anda mengedit ini untuk membuatnya lebih murni sebagai jawaban?
gung - Reinstate Monica
Maaf soal itu. Saya mengeditnya sekarang. Apakah sekarang terlihat lebih baik?
Tilen
1
Tidak perlu meminta maaf. Saya pikir jawaban Anda tersirat dalam apa yang Anda masukkan di sini, tetapi orang harus membaca yang tersirat. Bisakah Anda membuatnya eksplisit & mengikat semuanya? Namun, saya tidak yakin ini benar. Untuk menggunakan versi rumus, Anda memerlukan vektor nilai & indikator pengelompokan. Misalnya wilcox.test(values~ind, with(df, stack(var1=var1, var2=var2)), paired=FALSE),. Ketika saya melakukan itu, saya mendapatkan Wdua cara yang sama .
gung - Reinstate Monica