Mann-Whitney U-test: interval kepercayaan untuk ukuran efek

13

Menurut Fritz, Morris, dan Richler (2011; lihat di bawah), dapat dihitung sebagai ukuran efek untuk uji U Mann-Whitney menggunakan rumus r = zr ini nyaman untuk saya, karena saya melaporkanrjuga pada kesempatan lain. Saya ingin melaporkan interval kepercayaan untukrselain ukuran ukuran efek.

r=zN
rr

Ini pertanyaan saya :

  • Dapatkah saya menghitung interval kepercayaan untuk r seperti untuk Pearson's r, meskipun itu digunakan sebagai ukuran ukuran efek untuk tes nonparametrik?
  • Apa interval kepercayaan yang harus dilaporkan untuk pengujian satu sisi vs dua sisi?

Sunting mengenai pertanyaan kedua: "Apa interval kepercayaan yang harus dilaporkan untuk pengujian satu-ekor vs dua-ekor?"

Saya menemukan beberapa informasi yang IMHO dapat menjawab pertanyaan ini. "Sedangkan batas kepercayaan dua sisi membentuk interval kepercayaan, rekan satu sisi mereka disebut sebagai batas kepercayaan bawah atau atas." ( http://en.wikipedia.org/wiki/Confidence_interval ). Dari informasi ini saya menyimpulkan bahwa itu bukan masalah utama apakah pengujian signifikansi (misalnya, uji- ) adalah satu atau dua sisi, tetapi informasi apa yang orang tertarik sehubungan dengan CI untuk ukuran efek. Kesimpulan saya (tolong perbaiki saya jika Anda tidak setuju):t

  • CI dua sisi tertarik pada batas atas dan bawah (sebagai konsekuensinya, ada kemungkinan bahwa CI dua sisi memerlukan 0 meskipun uji signifikansi satu-sisi adalah p <0,05, terutama jika nilainya mendekati. 05.)
  • "CI" satu sisi hanya tertarik pada batas atas atau bawah (karena alasan teoretis); Namun, ini tidak selalu menjadi pertanyaan utama yang menarik setelah menguji hipotesis yang diarahkan. CI dua sisi sangat tepat jika fokusnya berada pada kisaran kemungkinan ukuran efek. Baik?

Lihat di bawah untuk bagian teks dari Fritz, Morris, & Richler (2011) tentang perkiraan ukuran efek untuk tes Mann-Whitney dari artikel yang saya rujuk di atas.

"Sebagian besar perkiraan ukuran efek yang kami jelaskan di sini mengasumsikan bahwa data memiliki distribusi normal. Namun, beberapa data tidak memenuhi persyaratan tes parametrik, misalnya, data pada skala ordinal tetapi bukan skala interval. Untuk data tersebut, peneliti biasanya beralih ke tes statistik nonparametrik, seperti tes Mann-Whitney dan Wilcoxon. Arti penting dari tes ini biasanya dievaluasi melalui perkiraan distribusi statistik uji ke distribusi ketika ukuran sampel tidak terlalu kecil, dan statistik paket, seperti SPSS, yang menjalankan tes ini melaporkan nilai z yang sesuai selain nilai untuk U atau T ; zzzUTzjuga dapat dihitung dengan tangan (misalnya, Siegel & Castellan, 1988). Nilai dapat digunakan untuk menghitung ukuran efek, seperti r yang diusulkan oleh Cohen (1988); Pedoman Cohen untuk r adalah bahwa efek besar adalah 0,5, efek sedang 0,3, dan efek kecil adalah 0,1 (Coolican, 2009, p. 395). Mudah untuk menghitung r , r 2 , atau η 2 dari nilai z ini karena r = zzrrr2η2z dan r2

r=zN
Perkiraan ukuran efek ini tetap independen dari ukuran sampel meskipun ada N dalam formula. Ini karena z sensitif terhadap ukuran sampel; membaginya dengan fungsi N menghilangkan efek ukuran sampel dari estimasi ukuran efek yang dihasilkan. "(hal. 12)
r2orη2=z2N
Abu-abu
sumber
Makalah ini tersedia secara gratis di sini .
asac

Jawaban:

9

Salah satu pilihan ukuran efek untuk tes Mann-Whitney U adalah ukuran efek bahasa yang umum. Untuk Mann-Whitney U, ini adalah proporsi pasangan sampel yang mendukung hipotesis yang dinyatakan.

Pilihan kedua adalah korelasi peringkat; karena korelasi peringkat berkisar dari -1 hingga +1, ia memiliki sifat yang mirip dengan Pearson r. Selain itu, dengan rumus perbedaan sederhana, korelasi peringkat adalah perbedaan antara ukuran efek bahasa yang umum dan pelengkapnya, sebuah fakta yang mempromosikan interpretasi. Misalnya, jika ada 100 pasangan sampel, dan jika 70 pasangan sampel mendukung hipotesis, maka ukuran efek bahasa umum adalah 70%, dan korelasi peringkat adalah r = .70 = .30 = .40 = .40. Diskusi yang jelas tentang ukuran efek bahasa umum dan empat formula untuk menghitung korelasi peringkat diberikan oleh Kerby dalam jurnal Innovative Teaching: Kerby (2014) Innovative Teaching

Ngomong-ngomong, meskipun makalah itu tidak menyebutkannya, saya cukup yakin bahwa Somers d dan korelasi peringkat untuk Mann-Whitney adalah setara.

DSK
sumber
1
Apakah maksud Anda "Misalnya, jika ada 100 pasangan yang memungkinkan "? Mann-Whitney U-test adalah untuk data yang tidak berpasangan, sehingga frasa tersebut ambigu - Anda mungkin ingin mengklarifikasi untuk pembaca tentang apa pasangan yang memungkinkan.
gung - Reinstate Monica
1
Terima kasih atas komentar dan kesempatan untuk mengklarifikasi. Saya merujuk pada pasangan sampel . Jika ada 10 pengamatan dalam sampel eksperimen, dan jika ada 10 pengamatan dalam sampel kontrol, maka ada 10 * 10 = 100 pasangan sampel . Menurut Robert Grissom, ukuran efek sampel adalah penaksir yang tidak bias dari ukuran efek populasi. Jadi, jika korelasi peringkat adalah r = .40 untuk sampel, ini adalah penaksir yang tidak bias dari ukuran efek populasi.
DSK
Saya menduga itu yang Anda maksud, @DSK. Saya pikir penjelasan itu akan membantu orang. Anda mungkin ingin mengeditnya menjadi jawaban Anda. Selamat Datang di CV.
gung - Reinstate Monica
8

Tautan Anda membuat saya berkesempatan untuk membeli artikel.

cHmiscrcorr.censcDxyDxy=2×(c12)

Frank Harrell
sumber
Terima kasih telah membawa ini ke pemberitahuan saya (tautan). Saya sekarang telah memasukkan bagian pada tes Mann-Whitney dalam pertanyaan saya.
abu
Terimakasih banyak atas jawaban Anda. Apakah Anda mungkin memiliki tautan tentang bagaimana menafsirkan indeks-c dan Somers 'D? Saya akan sangat tertarik pada apakah yang terakhir dapat diartikan sebanding dengan r. Saya memiliki dua sampel dan dalam sampel kedua (N lebih besar dan distribusi normal) saya laporkan r. Saya pikir itu akan membuat perbandingan hasil lebih mudah jika ukuran yang digunakan serupa - sejauh mungkin, tentu saja. Itu sebabnya saya tertarik pada formula yang disebutkan oleh Fritz et al. (2011). Jadi CI untuk r mereka tidak dapat dihitung seperti untuk Pearson r saya anggap? Terima kasih banyak lagi!
abu
zDxyYDc
Terimakasih banyak untuk respon Anda. Saya mencari beberapa informasi lebih lanjut tentang cara menafsirkan Somer, tetapi sejauh ini saya belum terlalu berhasil. Dapatkah Somer dipahami mirip dengan koefisien korelasi Pearson, misalnya apakah mengkuadratkannya menghasilkan koefisien determinasi? Saya akan sangat senang menemukan ukuran efek ukuran yang dapat diartikan mirip dengan r, jika ada.
abu
Saya menemukan beberapa informasi lebih lanjut tentang rumus r = Z / √ (N): Rosenthal (1991) menulis bahwa "kita dapat memperkirakan ukuran efek r dari tingkat ap saja selama kita tahu ukuran penelitian (N). Kami mengonversi p yang diperoleh ke standar deviate normal yang setara menggunakan tabel nilai Z. "
abu