Nilai kritis Wilcoxon-Mann-Whitney dalam R

10

Saya perhatikan bahwa ketika saya mencoba untuk menemukan nilai kritis untuk Mann-Whitney U menggunakan R, nilainya selalu 1 + nilai kritis. Misalnya, untuk , nilai kritis (berekor dua) adalah 8, sedangkan untuk , the (berekor dua) ) nilai kritis adalah 22 (periksa tabel ), tetapi:α=.05,n=10,m=5α=.05,n=12,m=8

> qwilcox(.05/2,10,5)
[1] 9
> qwilcox(.05/2,12,8)
[1] 23

Tentu saja saya tidak mempertimbangkan sesuatu, tapi ... ada yang bisa menjelaskan mengapa?

this.is.not.a.nick
sumber

Jawaban:

17

Saya pikir jawabannya di sini mungkin Anda membandingkan apel dan jeruk.

Biarkan menunjukkan cdf dari statistik Mann-Whitneyadalah fungsi kuantil dari . Menurut definisi, itu adalah F(x)UqwilcoxQ(α)U

Q(α)=inf{xN:F(x)α},α(0,1).

Karena adalah diskrit, biasanya tidak ada sehingga , jadi biasanya .UxF(x)=αF(Q(α))>α

Sekarang, pertimbangkan nilai kritis untuk pengujian. Dalam hal ini, Anda ingin , karena Anda akan memiliki tes dengan tingkat kesalahan tipe I yang lebih besar dari yang nominal. Ini biasanya dianggap tidak diinginkan; tes konservatif cenderung lebih disukai. Karenanya, Kecuali ada sehingga , oleh karena itu kami memiliki .C(α)F(C(α))α

C(α)=sup{xN:F(x)α},α(0,1).
xF(x)=αC(α)=Q(α)1

Alasan untuk perbedaan adalah yang qwilcoxtelah dirancang untuk menghitung kuantil dan bukan nilai kritis!

MånsT
sumber
1
(+1) Deskripsi singkat, bagus, ringkas. :)
kardinal
2

Ingat bahwa statistik uji peringkat pangkat adalah diskrit dan oleh karena itu Anda perlu menggunakan nilai kritis sedemikian sehingga probabilitas ekor adalah ke ditentukan . Untuk beberapa ukuran sampel yang sama dengan alfa tidak dapat dicapai dan itu adalah dugaan saya mengapa Anda membutuhkan +1.α

Michael R. Chernick
sumber
4
Jadi mengapa +1 dibutuhkan dalam R dan bukan di tabel biasa?
MånsT
1
@ this.is.not.a.nick: mungkin yang lebih penting, sedangkan , yang berarti bahwa dalam kasus sebelumnya tingkat signifikansi aktual akan dan pada yang terakhir akan . Biasanya orang cenderung lebih suka berbuat salah di sisi kanan, yaitu memiliki tingkat signifikansi yang lebih rendah daripada yang nominal (artinya nilai-nilai dari tabel lebih disukai). 0.0236723<0.0250.02868937>0.025<0.05>0.05
MånsT
1
Hak untuk Penunda dan Penasihat. Sebenarnya definisi tingkat signifikansi mensyaratkan bahwa probabilitas ekor tidak menjumlahkan sesuatu yang lebih tinggi dari alpha. Saya berbicara tentang hal ini dalam makalah saya dengan Christine Liu tentang perilaku gergaji fungsi daya untuk tes binomial yang tepat melalui metode Clopper-Pearson (lihat American Statistician (2002)).
Michael R. Chernick
2
@Michael: Ada di halaman yang sama dengan yang ini. Tabel mengikuti definisi standar, yang berarti bahwa nilai kritis bukan kuantil.
MånsT
3
@Michael: Setuju. Dalam beberapa hal, qwilcoxlakukan apa yang seharusnya dilakukan, tetapi tidak seperti yang Anda harapkan.
MånsT