Telah diketahui bahwa efisiensi relatif asimptotik (ADA) dari uji peringkat bertanda Wilcoxon adalah dibandingkan dengan Studentt-test, jika data diambil dari populasi terdistribusi normal. Ini berlaku untuk tes satu sampel dasar dan varian untuk dua sampel independen (Wilcoxon-Mann-Whitney U). Ini juga ARE dari tes Kruskal-Wallis dibandingkan dengan ANOVA F -test, untuk data normal.
Apakah ini yang luar biasa (bagi saya, salah satu " penampilan paling tak terduga dari ") dan hasil yang sangat sederhana memiliki bukti yang mendalam, luar biasa atau sederhana?
Jawaban:
Sketsa singkat ARE untuk satu sampelt -test, uji ditandatangani dan tes signed-rank
Saya berharap versi panjang jawaban @ Glen_b mencakup analisis terperinci untuk uji peringkat bertanda dua sampel bersama dengan penjelasan intuitif ARE. Jadi saya akan melewatkan sebagian besar derivasi. (satu sampel kasus, Anda dapat menemukan detail yang hilang di Lehmann TSH).
Masalah Pengujian : Misalkan menjadi sampel acak dari model lokasi f ( x - θ ) , simetris sekitar nol. Kita harus menghitung ARE dari uji yang ditandatangani, uji peringkat yang ditandatangani untuk hipotesis H 0 : θ = 0X1, ... , Xn f(x−θ) H0:θ=0 relatif terhadap uji-t.
Untuk menilai efisiensi relatif dari tes, hanya alternatif lokal yang dipertimbangkan karena tes yang konsisten memiliki daya cenderung 1 terhadap alternatif tetap. Alternatif lokal yang memunculkan kekuatan asimptotik nontrivial seringkali berupa untukhtetap, yang disebutPitman melayangdalam beberapa literatur.θn=h/n−−√ h
Tugas kita di depan adalah
Uji statistikics dan asimptotik
Oleh karena itu, A R E ( W n ) = ( √
Komentar tentang derivasi distribusi di bawah alternatif
Tentu saja ada banyak cara untuk memperoleh distribusi terbatas di bawah alternatif. Satu pendekatan umum adalah menggunakan lemma ketiga Le Cam. Versi disederhanakan menyatakannya
sumber
This has nothing to do with explaining whyπ appears (which was explained nicely by others) but may help intuitively. The Wilcoxon test is a t -test on the ranks of Y whereas the parametric test is computed on the raw data. The efficiency of the Wilcoxon test with respect to the t -test is the square of the correlation between the scores used for the two tests. As n→∞ the squared correlation converges to π3 . You can easily see this empirically using R:
sumber
n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2
(which obviously produces the same result)?Short version: The basic reason with the Wilcoxon-Mann-Whitney under a shift alternative is that finding the asymptotic relative efficiency (WMW/t) corresponds to evaluating12σ2[∫f2(x)dx]2 where f is the common density at the null and σ is the common variance.
So at the normal,f2 is effectively a scaled version of f ; its integral will have a 1π√ term; when squared, that's the source of the π .
The same term - with the same integral - is involved in the ARE for the signed rank test, so it takes the same value.
For the sign test relative to t, the ARE is4σ2f(0)2 ... and f(0)2 again has a π in it.
So essentially it's as I said in comments;π is in the ARE for the Wilcoxon-Mann-Whitney vs the two-sample t test, for the Wilcoxon signed rank test vs the one-sample t and the sign test vs the one-sample t test (in each case at the normal) quite literally because it appears in the normal density.
Reference:
J. L. Hodges and E. L. Lehmann (1956),
"The Efficiency of Some Nonparametric Competitors of the t-Test",
Ann. Math. Statist., 27:2, 324-335.
sumber