Kendall Tau atau Spearman rho?

69

Dalam kasus-kasus manakah seseorang harus lebih memilih yang satu daripada yang lain?

Saya menemukan seseorang yang mengklaim keuntungan untuk Kendall, karena alasan pedagogis , adakah alasan lain?

Tal Galili
sumber
Lihat juga pertanyaan terkait stats.stackexchange.com/q/18112/3277 .
ttnphns
1
Sayangnya, tautan dalam pertanyaan Anda sudah mati. Saya menganggap Anda mengacu pada Noether (2007, Pengajaran Statistik ) . Apakah Anda ingin mengeditnya?
S. Kolassa - Kembalikan Monica

Jawaban:

40

Saya menemukan bahwa korelasi Spearman sebagian besar digunakan sebagai pengganti korelasi linier biasa ketika bekerja dengan skor bernilai integer pada skala pengukuran, ketika itu memiliki jumlah kemungkinan skor yang moderat atau ketika kita tidak ingin mengandalkan asumsi tentang hubungan bivariat. . Dibandingkan dengan koefisien Pearson, interpretasi tau Kendall bagi saya tampaknya kurang langsung dibandingkan dengan Spearman rho, dalam arti bahwa itu mengukur perbedaan antara% pasangan yang bersesuaian dan sumbang di antara semua peristiwa berpasangan yang mungkin terjadi. Dalam pemahaman saya, tau Kendall lebih mirip dengan Goodman-Kruskal Gamma .

Saya baru saja melihat-lihat artikel dari Larry Winner di J. Statistics Educ. (2006) yang membahas penggunaan kedua tindakan, NASCAR Winston Cup Race Results untuk 1975-2003 .

Saya juga menemukan jawaban @onestop tentang korelasi Pearson atau Spearman dengan data tidak normal yang menarik dalam hal ini.

Sebagai catatan, Kendall's tau ( versi a ) memiliki koneksi ke Somers 'D (dan Harrell's C) yang digunakan untuk pemodelan prediktif (lihat misalnya, Interpretasi Somers' D di bawah empat model sederhana oleh RB Newson dan referensi 6 di dalamnya, dan artikel oleh Newson diterbitkan dalam Stata Journal 2006). Gambaran umum dari tes peringkat-sum disediakan dalam Perhitungan Efisien Interval Kepercayaan Jackknife untuk Statistik Peringkat , yang diterbitkan dalam JSS (2006).

chl
sumber
Terima kasih chl untuk jawabannya, saya menerimanya karena cakupannya semata. Terbaik, Tal
Tal Galili
Spearman menggunakan dua variabel bilangan bulat secara teratur tentang ikatan, yang tampaknya ditangani dengan lebih baik oleh Kendall's tau.
vinnief
29

Saya merujuk pria terhormat itu ke jawaban saya sebelumnya : "... interval kepercayaan untuk Spearman r S kurang dapat diandalkan dan kurang dapat ditafsirkan daripada interval kepercayaan untuk parameter τ Kendall", menurut Kendall & Gibbons (1990).

onestop
sumber
1
Saya pikir terima kasih kepada Roger Newson, karena saya hanya mengutip dari artikelnya.
onestop
22

Sekali lagi jawaban yang agak filosofis; perbedaan mendasarnya adalah bahwa Spearman's Rho merupakan upaya untuk memperluas gagasan R ^ 2 (= "varians dijelaskan") di atas interaksi nonlinier, sedangkan Kendall's Tau lebih dimaksudkan sebagai statistik uji untuk uji korelasi nonlinier. Jadi, Tau harus digunakan untuk menguji korelasi nonlinear, Rho sebagai ekstensi R (atau untuk orang yang akrab dengan R ^ 2 - menjelaskan Tau kepada audiens yang tidak curiga dalam waktu terbatas itu menyakitkan).


sumber
6
dapatkah Anda menjelaskan "interaksi non-linear". Spearman Rho tampaknya mencerminkan ukuran koefisien validitas dalam hal psikometri. Saya tidak tahu tentang sifat Tau.
Subhash C. Davar
Saya tidak mengerti hal psikometri komentar Anda.
Léo Léopold Hertz 준영
1
xx2
1
Itu hanya benar ketika x adalah non-negatif.
aocall
17

Berikut ini kutipan dari Andrew Gilpin (1993) yang menganjurkan Kendall's τ atas Spearman's ρ untuk alasan teoretis:

"[Kendall's ] mendekati distribusi normal lebih cepat daripada , karena , ukuran sampel, meningkat; dan juga lebih mudah ditelusur secara matematis, terutama ketika ada ikatan." ρ N ττρNτ

Referensi

Gilpin, AR (1993). Tabel untuk konversi Kendall's Tau ke Spearman's Rho dalam konteks mengukur besarnya efek untuk meta-analisis. Pengukuran Pendidikan dan Psikologis, 53 (1), 87-92.

Nick Stauner
sumber
3

FWIW, kutipan dari Myers & Well (desain penelitian dan analisis statistik, edisi kedua, 2003, hal. 510). Jika Anda masih peduli dengan nilai-p;

Seigel dan Castellan (1988, statistik nonparametrik untuk ilmu-ilmu perilaku) menunjukkan bahwa, meskipun dan Spearman akan umumnya memiliki nilai yang berbeda jika dihitung untuk set data yang sama, ketika tes signifikansi untuk dan Spearman didasarkan pada distribusi sampel mereka, mereka akan menghasilkan nilai- p yang sama .ρ τ ρτρτρ

Burak Aydin
sumber
Apakah Anda tahu jika mereka menawarkan dukungan untuk klaim ini? Saya tidak melihat bagaimana itu bisa benar secara umum (mereka mungkin cukup sering serupa, tetapi saya benar-benar tidak melihat bagaimana pernyataan bahwa mereka akan sama dapat bertahan). [Aku ingin tahu apakah Siegel dan Castellan benar-benar mengatakan hal itu, atau sesuatu yang sedikit berbeda.]
Glen_b
Saya telah memeriksa Siegel & Castellan (2ed p253). Mereka mengatakan sesuatu yang sedikit berbeda ... tetapi sebenarnya sedikit lebih buruk daripada parafrase di atas, bahkan dengan penambahan "kira-kira" (lebih buruk karena mereka membatasi itu menjadi kasus di bawah nol, tetapi karena mereka mengkondisikan data itu tidak akan membantu. Ngomong-ngomong, untuk urutan tetap , semua urutan urutan kemungkinan sama-sama kemungkinan di bawah H0.) Fakta bahwa mereka berpikir mengkondisikan pada nol setelah mengkondisikan pada hal-hal data adalah kekhawatiran. Saya ingin tahu apakah mereka bermaksud mengatakan sesuatu yang lain atau apakah mereka benar-benar salah pahamxy
Glen_b
Sebagai sampel tandingan, ambil n = 7 dan nilai p yang tepat. Misalkan x = 1,2,3,4,5,6,7 dan biarkan y = 2,1,4,3,7,6,5 ... spearman memberi p = 0,048, Kendall memberikan 0,136 ... yang sama sekali tidak sama. Pengaturan yang berbeda memberikan nilai yang sama untuk kendall tetapi spearman memiliki p = 0,302. Ada banyak contoh seperti itu dan berbagai ukuran sampel
Glen_b
3
Berikut ini plot untuk kasus n = 8. Seperti yang Anda lihat ada banyak variasi antara nilai-p untuk dua ukuran korelasi: i.stack.imgur.com/5JMbj.png ... Saya dapat menulis T&J tentang ini
Glen_b
1
Berikut adalah dua contoh kumpulan data (setelah peringkat) yang menunjukkan dua kasus (kali ini dengan n = 9) di mana nilai p korelasi Spearman adalah sama, tetapi nilai p korelasi Kendall sangat berbeda: i.stack.imgur. com / 3ILD8.png
Glen_b