Saya merasa ini mungkin telah ditanyakan di tempat lain, tetapi tidak benar-benar dengan jenis deskripsi dasar yang saya butuhkan. Saya tahu non-parametrik bergantung pada median alih-alih mean untuk membandingkan ... sesuatu. Saya juga percaya ini bergantung pada "derajat kebebasan" (?) Bukannya standar deviasi. Koreksi saya jika saya salah.
Saya telah melakukan penelitian yang cukup baik, atau begitulah menurut saya, mencoba memahami konsep, apa yang ada di baliknya, apa arti hasil tes sebenarnya, dan / atau apa yang harus dilakukan dengan hasil tes; Namun, tampaknya tidak ada yang berani pergi ke daerah itu.
Demi kesederhanaan mari kita tetap dengan uji-U Mann-Whitney, yang saya perhatikan cukup populer (dan juga tampaknya disalahgunakan dan digunakan secara berlebihan untuk memaksa "model persegi menjadi lubang lingkaran"). Jika Anda ingin mendeskripsikan tes-tes lain juga merasa bebas, walaupun saya merasa begitu saya memahaminya, saya bisa memahami yang lain dengan cara analog terhadap berbagai uji-t dll.
Katakanlah saya menjalankan tes non-parametrik dengan data saya dan saya mendapatkan hasil ini kembali:
2 Sample Mann-Whitney - Customer Type
Test Information
H0: Median Difference = 0
Ha: Median Difference ≠ 0
Size of Customer Large Small
Count 45 55
Median 2 2
Mann-Whitney Statistic: 2162.00
p-value (2-sided, adjusted for ties): 0.4156
Saya terbiasa dengan metode lain, tetapi apa yang berbeda di sini? Haruskah kita ingin nilai-p lebih rendah dari 0,05? Apa yang dimaksud dengan "statistik Mann-Whitney"? Apakah ada gunanya? Apakah informasi ini di sini hanya memverifikasi atau tidak memverifikasi bahwa sumber data tertentu yang saya miliki harus atau tidak boleh digunakan?
Saya memiliki cukup banyak pengalaman dengan regresi dan dasar-dasar, tetapi saya sangat ingin tahu tentang hal-hal non-parametrik "khusus" ini - yang saya tahu akan memiliki kekurangannya sendiri.
Bayangkan saja saya anak kelas lima dan lihat apakah Anda bisa menjelaskannya kepada saya.
Jawaban:
Hampir tidak ada tes nonparametrik yang benar-benar "mengandalkan" median dalam pengertian ini. Saya hanya bisa memikirkan pasangan ... dan satu-satunya yang saya perkirakan akan Anda dengar adalah tes tanda.
Jika mereka mengandalkan median, mungkin itu akan membandingkan median. Tetapi - terlepas dari apa yang beberapa sumber coba katakan kepada Anda - tes seperti tes peringkat yang ditandatangani, atau Wilcoxon-Mann-Whitney atau Kruskal-Wallis sama sekali bukan tes median sama sekali; jika Anda membuat beberapa asumsi tambahan, Anda dapat menganggap Wilcoxon-Mann-Whitney dan Kruskal-Wallis sebagai tes median, tetapi di bawah asumsi yang sama (selama sarana distribusi ada), Anda dapat menganggapnya sebagai uji kemampuan. .
Perkiraan lokasi aktual yang relevan dengan uji Peringkat Bertanda adalah median rata-rata berpasangan dalam sampel, yang untuk Wilcoxon-Mann-Whitney (dan implikasinya, dalam Kruskal-Wallis) adalah median perbedaan berpasangan di seluruh sampel. .
Sebagian besar tes nonparametrik tidak memiliki 'derajat kebebasan', meskipun distribusi banyak perubahan dengan ukuran sampel dan Anda mungkin menganggapnya agak mirip dengan derajat kebebasan dalam arti bahwa tabel berubah dengan ukuran sampel. Sampel tentu saja mempertahankan sifat mereka dan memiliki n derajat kebebasan dalam arti itu tetapi tingkat kebebasan dalam distribusi statistik uji biasanya bukan sesuatu yang kita khawatirkan. Dapat terjadi bahwa Anda memiliki sesuatu yang lebih mirip derajat kebebasan - misalnya, Anda tentu dapat membuat argumen bahwa Kruskal-Wallis memang memiliki derajat kebebasan pada dasarnya dalam arti yang sama dengan chi-square, tetapi biasanya tidak melihat seperti itu (misalnya, jika seseorang berbicara tentang derajat kebebasan seorang Kruskal-Wallis, mereka hampir selalu berarti
Diskusi yang bagus tentang derajat kebebasan dapat ditemukan di sini /
Saya tidak yakin apa yang Anda maksudkan dengan ini.
Saya dapat menyarankan beberapa buku, seperti Conover's Practical Nonparametric Statistics , dan jika Anda bisa mendapatkannya, buku Neave dan Worthington ( Distribusi-Tes Gratis ), tetapi ada banyak buku lain - Marascuilo & McSweeney, Hollander & Wolfe, atau buku Daniel misalnya. Saya sarankan Anda membaca setidaknya 3 atau 4 dari yang berbicara kepada Anda yang terbaik, lebih disukai yang menjelaskan hal-hal yang berbeda mungkin (ini berarti setidaknya membaca sedikit mungkin 6 atau 7 buku untuk menemukan mengatakan 3 yang sesuai).
Yaitu, yang membuat saya bingung dengan pernyataan Anda "sepertinya tidak ada yang berani memasuki area itu" - banyak orang yang menggunakan tes ini melakukan 'menjelajah ke area' yang Anda bicarakan.
Saya akan mengatakan tes nonparametrik umumnya kurang digunakan jika ada (termasuk Wilcoxon-Mann-Whitney) - sebagian besar terutama tes permutasi / pengacakan, meskipun saya tidak perlu membantah bahwa mereka sering disalahgunakan (tetapi begitu juga tes parametrik, bahkan lebih).
[menggunting]
Metode lain apa yang Anda maksud? Anda ingin saya membandingkan ini dengan apa?
Sunting: Anda menyebutkan regresi nanti; Saya berasumsi bahwa Anda terbiasa dengan uji-t dua sampel (karena ini benar-benar kasus regresi khusus).
Di bawah asumsi untuk uji-dua sampel biasa, hipotesis nol menyatakan bahwa kedua populasi itu identik, berlawanan dengan alternatif yang telah diubah oleh salah satu distribusi. Jika Anda melihat yang pertama dari dua set hipotesis untuk Wilcoxon-Mann-Whitney di bawah ini, hal dasar yang diuji di sana hampir identik; hanya saja uji-t didasarkan pada asumsi sampel berasal dari distribusi normal yang identik (terlepas dari kemungkinan pergeseran lokasi). Jika hipotesis nol benar, dan asumsi yang menyertainya benar, statistik uji memiliki t-distribusi. Jika hipotesis alternatif itu benar, maka uji-statistik menjadi lebih mungkin untuk mengambil nilai-nilai yang tidak terlihat konsisten dengan hipotesis nol tetapi terlihat konsisten dengan alternatif - kami fokus pada yang paling tidak biasa,
Situasinya sangat mirip dengan Wilcoxon-Mann-Whitney, tetapi mengukur penyimpangan dari nol agak berbeda. Bahkan, ketika asumsi uji-t benar *, hampir sebaik tes terbaik (yaitu uji-t).
* (yang dalam praktiknya tidak pernah, meskipun itu tidak masalah sebanyak kedengarannya)
Memang, mungkin untuk mempertimbangkan Wilcoxon-Mann-Whitney secara efektif sebagai "uji-t" yang dilakukan pada jajaran data - meskipun kemudian tidak memiliki distribusi-t; statistik adalah fungsi monotonik dari dua sampel t-statistik yang dihitung pada peringkat data, sehingga menginduksi urutan yang sama ** pada ruang sampel (yaitu "uji-t" pada peringkat - dilakukan dengan tepat - akan menghasilkan nilai-p yang sama dengan Wilcoxon-Mann-Whitney), sehingga menolak kasus yang sama persis.
** (ketat, pemesanan parsial, tapi mari kita kesampingkan itu)
[Anda akan berpikir bahwa hanya dengan menggunakan peringkat akan membuang banyak informasi, tetapi ketika data diambil dari populasi normal dengan varian yang sama, hampir semua informasi tentang pergeseran lokasi berada dalam pola peringkat. Nilai data aktual (tergantung pada peringkat mereka) menambahkan sangat sedikit informasi tambahan untuk itu. Jika Anda menjadi lebih berat dari biasanya, itu tidak lama sebelum tes Wilcoxon-Mann-Whitney memiliki kekuatan yang lebih baik, serta mempertahankan tingkat signifikansi nominalnya, sehingga informasi 'ekstra' di atas peringkat akhirnya menjadi tidak hanya tidak informatif tetapi dalam beberapa akal, menyesatkan. Namun, berekor berat yang hampir simetris adalah situasi yang jarang terjadi; apa yang sering Anda lihat dalam praktik adalah kemiringan.]
Gagasan dasarnya sangat mirip, nilai-p memiliki interpretasi yang sama (probabilitas hasil sebagai, atau lebih ekstrim, jika hipotesis nol itu benar) - hingga interpretasi pergeseran lokasi, jika Anda membuat asumsi yang diperlukan (lihat pembahasan hipotesis di dekat akhir posting ini).
Jika saya melakukan simulasi yang sama seperti pada plot di atas untuk uji-t, plot akan terlihat sangat mirip - skala pada sumbu x dan y akan terlihat berbeda, tetapi tampilan dasarnya akan serupa.
Anda seharusnya tidak "menginginkan" apa pun di sana. Idenya adalah untuk mengetahui apakah sampel lebih berbeda (dalam arti lokasi) daripada yang dapat dijelaskan secara kebetulan, bukan untuk 'mengharapkan' hasil tertentu.
Jika saya mengatakan "Bisakah Anda pergi melihat apa mobil warna Raj adalah please?", Jika saya ingin penilaian berisi itu saya tidak ingin kau pergi "Man, aku benar-benar, benar-benar berharap itu biru! Itu hanya memiliki untuk menjadi biru". Sebaiknya hanya melihat situasinya, daripada masuk dengan beberapa 'Aku butuh itu menjadi sesuatu'.
Jika tingkat signifikansi yang Anda pilih adalah 0,05, maka Anda akan menolak hipotesis nol ketika nilai-p di bawah 0,05. Tetapi kegagalan untuk menolak ketika Anda memiliki ukuran sampel yang cukup besar untuk hampir selalu mendeteksi efek-ukuran yang relevan setidaknya sama menarik, karena dikatakan bahwa perbedaan yang ada kecil.
Statistik Mann-Whitney .
Ini benar-benar hanya bermakna dibandingkan dengan distribusi nilai-nilai yang dapat diambil ketika hipotesis nol benar (lihat diagram di atas), dan itu tergantung pada definisi mana dari beberapa program tertentu yang mungkin digunakan.
Biasanya Anda tidak peduli dengan nilai pastinya, tetapi di mana ia terletak pada distribusi nol (apakah itu lebih atau kurang khas dari nilai-nilai yang harus Anda lihat ketika hipotesis nol itu benar, atau apakah itu lebih ekstrim)
Tes ini tidak mengatakan apa-apa tentang "sumber data tertentu yang saya harus atau tidak boleh digunakan".
Lihat diskusi saya tentang dua cara melihat hipotesis WMW di bawah ini.
Tidak ada yang khusus tentang tes nonparametrik (saya akan mengatakan yang 'standar' dalam banyak hal bahkan lebih mendasar daripada tes parametrik khas) - selama Anda benar-benar memahami pengujian hipotesis.
Namun, itu mungkin topik untuk pertanyaan lain.
Ada dua cara utama untuk melihat uji hipotesis Wilcoxon-Mann-Whitney.
i) Salah satunya adalah mengatakan "Saya tertarik pada pergeseran-lokasi - yaitu bahwa berdasarkan hipotesis nol, kedua populasi memiliki distribusi (kontinu) yang sama , terhadap alternatif bahwa seseorang 'bergeser' ke atas atau ke bawah relatif terhadap lain"
Wilcoxon-Mann-Whitney berfungsi dengan sangat baik jika Anda membuat asumsi ini (bahwa alternatif Anda hanyalah perubahan lokasi)
Dalam hal ini, Wilcoxon-Mann-Whitney sebenarnya adalah tes untuk median ... tetapi sama-sama itu adalah tes untuk rata-rata, atau memang statistik kesetaraan lokasi lainnya (persentil ke-90, misalnya, atau sarana yang dipangkas, atau sejumlah hal-hal lain), karena semuanya terpengaruh dengan cara yang sama oleh pergeseran lokasi.
Hal yang menyenangkan tentang ini adalah ia sangat mudah ditafsirkan - dan mudah untuk menghasilkan interval kepercayaan untuk perubahan lokasi ini.
Namun, uji Wilcoxon-Mann-Whitney sensitif terhadap perbedaan jenis lain daripada pergeseran lokasi.
sumber
Misalkan Anda dan saya melatih tim trek. Atlet kami berasal dari sekolah yang sama, usia yang sama, dan jenis kelamin yang sama (yaitu, mereka berasal dari populasi yang sama), tetapi saya mengklaim telah menemukan Sistem Pelatihan Baru yang Revolusioner yang akan membuat anggota tim saya berlari lebih cepat daripada milikmu. Bagaimana saya bisa meyakinkan Anda bahwa itu benar-benar berhasil?
Kami berlomba.
Setelah itu, saya duduk dan menghitung rata-rata waktu untuk anggota tim saya dan rata-rata waktu untuk anggota Anda. Saya akan mengklaim kemenangan jika waktu rata-rata untuk atlet saya tidak hanya lebih cepat daripada rata-rata untuk atlet Anda, tetapi perbedaannya juga besar dibandingkan dengan "hamburan", atau standar deviasi, dari hasil kami.
"Tapi Matt", Anda mengeluh, "ini tidak cukup adil. Tim kami sangat mirip, tetapi Anda - karena kebetulan murni - berakhir dengan pelari tercepat di distrik ini. Dia tidak berada di liga yang sama dengan semua orang yang lain, dia bisa dibilang orang aneh Alam. Dia selesai 3 menit sebelum finisher tercepat berikutnya, yang mengurangi banyak waktu rata-rata Anda, tetapi seluruh pesaing cukup merata. Mari kita lihat urutan selesai sebagai gantinya. Jika metode Anda benar-benar bekerja, finishers sebelumnya sebagian besar harus dari tim Anda, tetapi jika tidak, order finish harus cukup acak. Ini tidak memberikan bobot yang tidak semestinya kepada super-star Anda! "
sumber
Anda meminta dikoreksi jika salah. Berikut adalah beberapa komentar di bawah judul yang melengkapi saran positif @Peter Flom.
"non-parametrik bergantung pada median, bukan rata-rata": sering dalam praktik, tapi itu bukan definisi. Beberapa tes non-parametrik (misalnya chi-square) tidak ada hubungannya dengan median.
bergantung pada derajat kebebasan alih-alih standar deviasi; itu sangat membingungkan. Gagasan derajat kebebasan sama sekali bukan alternatif dari standar deviasi; derajat kebebasan sebagai suatu gagasan berlaku tepat di seluruh statistik.
"sumber data tertentu yang saya harus atau tidak boleh digunakan": pertanyaan ini tidak ada hubungannya dengan tes signifikansi yang Anda terapkan, yang hanya tentang perbedaan antara himpunan bagian data dan diutarakan dalam hal perbedaan antara median.
sumber
Anda "ingin" hal-hal yang sama dari nilai-p di sini yang Anda inginkan dalam pengujian lain.
Statistik U adalah hasil perhitungan, seperti statistik t, rasio odds, statistik F, atau apa pun yang Anda miliki. Formula dapat ditemukan banyak tempat. Ini tidak terlalu intuitif, tetapi kemudian, tidak ada statistik tes lain sampai Anda terbiasa dengan mereka (kami mengenali pada 2 sebagai berada dalam kisaran yang signifikan karena kami melihatnya sepanjang waktu).
Sisa output dalam teks blok Anda harus jelas.
Untuk pengantar yang lebih umum untuk tes nonparametrik, saya menggemakan @NickCox .... dapatkan buku yang bagus. Non-parametrik berarti "tanpa parameter"; ada banyak tes dan statistik non-parametrik untuk berbagai tujuan.
sumber
Sebagai tanggapan terhadap pertanyaan yang baru saja ditutup , ini juga membahas hal di atas. Di bawah ini adalah kutipan dari Tes Statistik Bebas-Distribusi klasik Bradley (1968, hlm. 15-16) yang, walaupun agak panjang, adalah penjelasan yang cukup jelas, saya percaya.
sumber