Pangkat dan z-alih alih-alih Wilcoxon?

8

Andrew Gelman dalam sebuah posting baru-baru ini di blognya menyarankan menggunakan peringkat, mengubah peringkat menjadi skor-z, dan kemudian menggunakan tes parametrik dan alat alih-alih melakukan tes non-parametrik. Saya tidak pernah mendengar itu sebelumnya.

Pencarian di Google menunjukkan kepada saya fungsi R ini dalam paket GenABEL , yang tampaknya melakukan peringkat + z-transformasi dari data vektor tetapi saya tidak dapat menemukan makalah yang mengevaluasi atau mendiskusikan gagasan menggunakan tes parametrik pada data yang ditransformasi sebagai gantinya tes Wilcoxon.

Adakah yang bisa mengarahkan saya ke beberapa literatur tentang metode ini?

Jacques Wainer
sumber
2
Ini bukan tes parametrik. Anda baru saja menggunakan perkiraan asimptotik dari distribusi nol dari statistik berbasis peringkat.
dsaxton
1
@dsaxton Dalam banyak kasus ini adalah tes nonparametrik (atau, lebih tepatnya, perkiraan untuk satu). Mengganti peringkat dengan set skor tertentu (mengingat ukuran sampel) tidak mengubah kurangnya ketergantungan pada bentuk distribusi asli di bawah nol.
Glen_b -Reinstate Monica

Jawaban:

10

(Menarik Conover [1] dari rak buku ...)

Gagasan ini cukup lama; setidaknya kembali ke van der Waerden (1952/1953) [2] [3], yang menyarankan tes yang sesuai dengan Kruskal Wallis tetapi dengan peringkat digantikan oleh skor normal. (Gagasan menggunakan nilai normal acak yang diurutkan daripada perkiraan atau median mereka - mungkin bahkan sedikit lebih tua.)

Menurut Conover, Fisher dan Yates (1957) [4] menyarankan mengganti pengamatan dengan skor normal yang diharapkan (yaitu peringkat yang diubah) dalam berbagai tes di mana normalitas akan diasumsikan.

Efisiensi relatif asimptotik pada normal akan menjadi 1, yang membuatnya terdengar cukup menarik ... namun, kelebihan dibandingkan mengatakan Wilcoxon-Mann-Whitney (mendapatkan kekuatan) - bahkan pada normal - cukup kecil, dan jika distribusi lebih berat dari biasanya (misalkan logistik), mungkin tidak menguntungkan untuk melakukan ini. (Beberapa simulasi menunjukkan bahwa faktanya memang demikian: kecuali jika distribusinya sudah mendekati normal - dalam hal ini tidak ada manfaatnya untuk melakukan transformasi - transformasi semacam itu dapat kehilangan daya.)

Chernoff & Lehmann [5] menghitung daya asimptotik untuk berbagai distribusi; di mana ada setidaknya satu ekor yang sangat pendek (seperti seragam), tes skor normal dapat memiliki ADALAH yang jauh lebih baik untuk alternatif shift melawan Wilcoxon-Mann-Whitney - lebih baik daripada uji-t itu sendiri. Hasil mereka setuju dengan simulasi saya untuk kasus ekor yang lebih berat.

Perhatikan bahwa dalam kasus dua sampel, karena pemisahan dalam sarana menjadi besar, sedangkan sampel gabungan terlihat cukup normal, kedua sampel tidak normal sama sekali:

masukkan deskripsi gambar di sini

Akibatnya, tidak semua sifat dari tes normal akan terbawa ke tes skor normal, dan perilaku pada pemisahan yang lebih besar (dengan sampel kecil) mungkin agak berlawanan dengan intuisi.

Tes yang diperoleh oleh ide ini kadang-kadang secara kolektif disebut tes skor normal , yang istilah pencariannya (via Google, katakan) menghasilkan sejumlah referensi.

Sebagai contoh, di sini , Richard Darlington membahas melakukannya untuk ujian peringkat yang ditandatangani Wilcoxon; dia menunjukkan ada keunggulan dibandingkan tes peringkat biasa, karena mengurangi jumlah nilai terikat dari statistik tes.

Sebelum saya akhirnya menulis halaman di atasnya, saya akan meninggalkan Anda untuk mencari lebih jauh.

Conover mendaftar sejumlah referensi lain dan memiliki sedikit diskusi, jadi saya pasti akan merekomendasikan membacanya.

Poin Gelman, bagaimanapun, tampaknya tentang kenyamanan - tidak perlu mengembangkan tes baru setiap kali situasinya berubah; meskipun jika kenyamanan adalah masalah utama sudah ada kemampuan untuk menggunakan tes permutasi pada statistik apa pun yang kita suka. [Dengan pendekatan skor normal, kesulitannya adalah kita masih membutuhkan cara yang sesuai untuk memeringkat - Anda tidak bisa hanya memberi peringkat hal-hal yang tidak sebanding dengan nol dan mengharapkan jenis perilaku yang tepat. Ada masalah serupa dengan tes permutasi, karena Anda juga membutuhkan pertukaran di bawah nol.]

Anda menyebutkan fungsi R, tetapi Anda bisa memberi peringkat dan mengonversi ke skor normal dengan mudah di R hanya menggunakan fungsi yang sudah ada bersama R.

mis. menggunakan sleepdata dalam R. Anda akan melakukan uji-t dengan cara ini:

 t.test(extra ~ group, data = sleep)  # Welch
 t.test(extra ~ group, data = sleep, var.equal=TRUE)  # equal-variance
 t.test(qqnorm(extra,plot=FALSE)$x ~ group, data = sleep)  # normal scores

[1] Conover, WJ (1980),
Praktis Statistik Nonparameter , 2e.
Wiley. hlm. 316–327.

(Dari tautan Wikipedia di atas seperti pada 3e (1999) diskusi dimulai pada hal. 396)

[2] van der Waerden, BL (1952),
"Urutan tes untuk masalah dua sampel dan kekuatan mereka",
Prosiding Koninklijke Nederlandse Akademie van Wetenschappen , Seri A 55 ( Indagationes Mathematicae 14 ), 453–458.

[3] van der Waerden, BL (1953),
"Urutan tes untuk masalah dua sampel. II, III",
Prosiding Koninklijke Nederlandse Akademie van Wetenschappen , Seri A 56 ( Indagationes Mathematicae , 15 ), 303-310 & 311–316.

(ada juga koreksi pada makalah 1952 di halaman 80 dari volume itu)

[4] Fisher RA dan Yates F. (1957)
Tabel Statistik untuk Penelitian Biologis, Pertanian, dan Medis , 5e, Oliver & Boyd, Edinburgh.

[5] Hodges, JL; Lehmann, EL (1961),
"Perbandingan Skor Normal dan Tes Wilcoxon,"
Prosiding Simposium Berkeley Keempat tentang Statistik dan Probabilitas Matematika, Volume 1: Kontribusi Teori Teori Statistik , 307--317,
University of California Press, Berkeley, California.
Http://projecteuclid.org/euclid.bsmsp/1200512171 .

Glen_b -Reinstate Monica
sumber
Glen, ini topik yang menarik (yang ingin saya pelajari lebih lanjut) dan jawaban yang bagus untuk Anda. Tapi bisakah saya memohon Anda untuk menambahkan daging (wacana / kesimpulan) ke dalamnya selain hanya tautan? Dan, mungkin, kumpulkan beberapa tautan ke tanya-jawab serupa di situs ini? Terima kasih.
ttnphns
Topik bagus Apakah ada perbandingan apel-ke-apel yang diterbitkan dari pendekatan nonparametrik dan pendekatan skor normal (dengan uji parametrik) untuk uji perbedaan dalam rata-rata? Kolega saya dan saya memiliki beberapa tes korelasi, tetapi hanya itu yang saya ketahui. Dalam konteks korelasi, skor normal mengarah pada kekuatan yang sedikit lebih baik daripada tes peringkat (korelasi Spearman) atau uji parametrik yang tidak diubah (Pearson). Saya ingin tahu apakah hasil serupa terjadi dalam konteks lain.
Anthony
1
@Antony. Butir [5] yang ditunjukkan oleh Glen, berisi perbandingan skor normal dengan Wilcoxon dari apel ke apel berdasarkan efisiensi asimptotik. Cendekia mendaftar 114 kutipan pada makalah itu, beberapa di antaranya harus memberikan bentuk perbandingan lain.
Jacques Wainer
1
@ Glen_b, untuk korelasi, keunggulan skor normal paling menonjol ketika kedua variabel sangat tidak normal (misalnya, ~ ) dan n besar (> = 20, tetapi bahkan lebih besar menunjukkan keunggulan lebih besar ). Pekerjaan lain menunjukkan masalah skewness dan kurtosis. Jika tertarik, referensi dapat ditemukan di sini: stats.stackexchange.com/questions/131369/…χ2,df=1
Anthony
1
Maaf untuk semua komentar, tetapi saya tidak dapat menahan utas yang menyenangkan ini! Satu lagi pemikiran - Angka @ Glen_b menunjuk ke masalah yang disebut "warisan" oleh Zimmerman (2011). Bahkan setelah transformasi, sampel yang terpisah dapat "mewarisi" beberapa sifat dari distribusi asli yang tidak diubah. redalyc.org/articulo.oa?id=16917012005
Anthony