Mengapa efisiensi relatif asimptotik dari uji Wilcoxon

13

Telah diketahui bahwa efisiensi relatif asimptotik (ADA) dari uji peringkat bertanda Wilcoxon adalah 3π0,955dibandingkan dengan Studentt-test, jika data diambil dari populasi terdistribusi normal. Ini berlaku untuk tes satu sampel dasar dan varian untuk dua sampel independen (Wilcoxon-Mann-Whitney U). Ini juga ARE dari tes Kruskal-Wallis dibandingkan dengan ANOVA F -test, untuk data normal.

Apakah ini yang luar biasa (bagi saya, salah satu " penampilan paling tak terduga dari π ") dan hasil yang sangat sederhana memiliki bukti yang mendalam, luar biasa atau sederhana?

Gegat
sumber
Mengingat penampilan π di cdf normal, penampilan π di ADALAH harus benar-benar menjadi semua yang mengejutkan. Saya akan membahayakan jawaban tetapi butuh beberapa saat untuk membuat jawaban yang bagus.
Glen_b -Reinstate Monica
1
@Glen_b Memang - saya telah melihat diskusi "mengapa muncul begitu banyak dalam statistik" sebelumnya (meskipun tidak ingat apakah itu di CV atau tidak) dan "karena distribusi normal" Saya tahu banyak muncul, tapi 3 / π masih senang mengejutkan saat pertama kali melihatnya. Sebagai perbandingan , ARE dari Mann-Whitney vs t-test dua sampel adalah 3 pada data eksponensial, 1,5 pada eksponensial ganda dan 1 pada seragam - jauh lebih bulat! π3/π
Silverfish,
1
@Silverfish Saya telah menghubungkan halaman 197 dari van der Vaart "Statistik Asimptotik". Untuk satu sampel, uji-tanda memiliki ARE relatif terhadap uji-t. 2/π
Khashaa
1
@Silverfish ... dan pada logistiknya adalah . Ada beberapa ARE yang terkenal (dalam satu atau dua kasus sampel) yang melibatkan π dan beberapa yang merupakan rasio sederhana bilangan bulat. (π/3)2π
Glen_b -Reinstate Monica
1
Untuk uji peringkat bertanda satu sampel, tampaknya menjadi . Untuk uji tanda satu sampel, hasilnya 2 / π . Jadi, kami mengklarifikasi posisi kami. Saya pikir itu pertanda baik. 3/π2/π
Khashaa

Jawaban:

10

Sketsa singkat ARE untuk satu sampel t -test, uji ditandatangani dan tes signed-rank

Saya berharap versi panjang jawaban @ Glen_b mencakup analisis terperinci untuk uji peringkat bertanda dua sampel bersama dengan penjelasan intuitif ARE. Jadi saya akan melewatkan sebagian besar derivasi. (satu sampel kasus, Anda dapat menemukan detail yang hilang di Lehmann TSH).

Masalah Pengujian : Misalkan menjadi sampel acak dari model lokasi f ( x - θ ) , simetris sekitar nol. Kita harus menghitung ARE dari uji yang ditandatangani, uji peringkat yang ditandatangani untuk hipotesis H 0 : θ = 0X1,...,Xnf(x-θ)H0:θ=0 relatif terhadap uji-t.

Untuk menilai efisiensi relatif dari tes, hanya alternatif lokal yang dipertimbangkan karena tes yang konsisten memiliki daya cenderung 1 terhadap alternatif tetap. Alternatif lokal yang memunculkan kekuatan asimptotik nontrivial seringkali berupa untukhtetap, yang disebutPitman melayangdalam beberapa literatur.θn=h/nh

Tugas kita di depan adalah

  • temukan batas distribusi setiap statistik uji di bawah nol
  • temukan batas distribusi setiap statistik uji di bawah alternatif
  • menghitung kekuatan asimptotik lokal dari setiap tes

Uji statistikics dan asimptotik

  1. t-test (diberi keberadaan ) t n = σt n =
    tn=nX¯σ^dN(0,1)di bawah nol
    tn=nX¯σ^dN(h/σ,1)under the alternative θ=h/n
    • jadi tes yang menolak jika memiliki fungsi daya asimptotik 1 - Φ ( z α - h 1tn>zα
      1Φ(zαh1σ)
  2. tes yang ditandatangani Sn=1ni=1n1{Xi>0}
    n(Sn12)dN(0,14)under the null 
    dan memiliki lokal listrik asymptotic 1 - Φ ( z α - 2 h f ( 0 ) )
    n(Sn12)dN(hf(0),14)under the alternative 
    1Φ(zα2hf(0))
  3. uji signed-rank W n d N ( 2 h f 2 , 1
    Wn=n2/3i=1nRi1{Xi>0}dN(0,13)under the null 
    dan memiliki kekuatan asimptotik lokal 1 - Φ ( z α -
    WndN(2hf2,13)under the alternative 
    1Φ(zα12hf2)

Oleh karena itu, A R E ( W n ) = (

ARE(Sn)=(2f(0)σ)2
Jikafadalah kepadatan normal standar,ARE(Sn)=2/π,ARE(Wn)=3/π
SEBUAHRE(Wn)=(12f2σ)2
fARE(Sn)=2/πARE(Wn)=3/π

fARE(Sn)=1/3ARE(Wn)=1/3

Komentar tentang derivasi distribusi di bawah alternatif

Tentu saja ada banyak cara untuk memperoleh distribusi terbatas di bawah alternatif. Satu pendekatan umum adalah menggunakan lemma ketiga Le Cam. Versi disederhanakan menyatakannya

ΔnWn

(Wn,Δn)dN[(μσ2/2),(σW2ττσ2/2)]
WndN(μ+τ,σW2)under the alternative

cov(Wn,Δn)Δn

Δnhni=1nl(Xi)12h2I0
where l is score function, I0 is information matrix. Then, for instance, for signed test Sn
cov(n(Sn1/2),Δn)=hcov(1{Xi>0},ff(Xi))=h0f=hf(0)
Khashaa
sumber
+1 Saya tidak akan membahas detail sebanyak ini (memang, dengan jawaban Anda sudah cukup baik, saya mungkin tidak akan menambahkan apa pun pada apa yang saya miliki sekarang) jadi jika Anda ingin lebih detail, jangan ' t menahan akun saya. Saya sudah beberapa hari (dan masih kurang dari yang sudah Anda miliki), jadi itu hal yang baik Anda datang.
Glen_b -Reinstate Monica
This is a nice answer particularly for adding in Le Cam's lemma (+1). It seems to me there is quite a big jump between establishing the asymptotics in 1, 2, and 3, and the "therefore" bit where you write the AREs. I think if I were writing this up, I'd define asymptotic efficiency at this point (or maybe earlier, so the upshot of points 1, 2 and 3 would be the AEs not just local asymptotic powers in each case) and then the step to the AREs would be much easier for future readers to follow.
Silverfish
Perhaps it is worth specifying your H1? One-sided and two-sided cases have different-looking asymptotic powers (though they lead to the same AREs).
Silverfish
Silakan mengedit jawaban saya atau menambahkannya ke OP.
Khashaa
1
@Khashaa Thanks. I shall edit your post when I have the right stuff in front of me. Would you mind clarifying the meaning of the in the final equation?
Silverfish
6

This has nothing to do with explaining why π appears (which was explained nicely by others) but may help intuitively. The Wilcoxon test is a t-test on the ranks of Y whereas the parametric test is computed on the raw data. The efficiency of the Wilcoxon test with respect to the t-test is the square of the correlation between the scores used for the two tests. As n the squared correlation converges to π3. You can easily see this empirically using R:

n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297
Frank Harrell
sumber
This is indeed a very helpful comment. Is it slightly conceptually closer to do n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2 (which obviously produces the same result)?
Silverfish
(People intrigued by Frank's comment may want to look at this question about the equivalence of Wilcoxon-Mann-Whitney U and a t-test on the ranks.)
Silverfish
something I don't understand about this answer is that the correlation is higher for lower values of n (I think the proximal reason is that we don't see the tails very well for smaller n). Naively that implies that the relative efficiency of the Wilcoxon is higher for small n, which surprises me ... ?? (I might do some simulations, but (a) if there's an easy answer ... and (b) am I missing a conceptual point somewhere?)
Ben Bolker
To my recollection the small sample efficiency of both the Wilcoxon signed rank test and the W-M-W are a bit lower than the asymptotic value on shift alternatives at the normal distribution.
Glen_b -Reinstate Monica
5

Short version: The basic reason with the Wilcoxon-Mann-Whitney under a shift alternative is that finding the asymptotic relative efficiency (WMW/t) corresponds to evaluating 12σ2[f2(x)dx]2 where f is the common density at the null and σ is the common variance.

So at the normal, f2 is effectively a scaled version of f; its integral will have a 1π term; when squared, that's the source of the π.

The same term - with the same integral - is involved in the ARE for the signed rank test, so it takes the same value.

For the sign test relative to t, the ARE is 4σ2f(0)2... and f(0)2 again has a π in it.

So essentially it's as I said in comments; π is in the ARE for the Wilcoxon-Mann-Whitney vs the two-sample t test, for the Wilcoxon signed rank test vs the one-sample t and the sign test vs the one-sample t test (in each case at the normal) quite literally because it appears in the normal density.

Reference:

J. L. Hodges and E. L. Lehmann (1956),
"The Efficiency of Some Nonparametric Competitors of the t-Test",
Ann. Math. Statist., 27:2, 324-335.

Glen_b -Reinstate Monica
sumber
I like the explanation for the intuition for the appearance of π in the denominator; is it essentially coincidence that the Renyi entropy turns up in the WMW/Wilcoxon integrals?
Silverfish
@Silverfish That f2dx turns up is certainly not coincidence. However, that's not because that's connected to Rényi entropy, or at least I don't see any direct connection. We're getting into stuff I don't really know about now, though.
Glen_b -Reinstate Monica
@Silverfish It's only a Renyi entropy for α=2. Otherwise, it is just a plain old square that can come up in a million different ways.
abalter