Koefisien Pearson antara dua variabel cukup tinggi (r = .65). Tetapi ketika saya peringkat nilai variabel dan menjalankan korelasi Spearman, nilai cofficient jauh lebih rendah (r = .30).
- Apa interpretasi dari ini?
correlation
spearman-rho
pengguna3671
sumber
sumber
Jawaban:
Kenapa bedanya besar
Jika data Anda terdistribusi normal atau terdistribusi secara seragam, saya akan berpikir bahwa korelasi Spearman dan Pearson harus sama.
Jika mereka memberikan hasil yang sangat berbeda seperti dalam kasus Anda (0,65 vs 0,30), tebakan saya adalah bahwa Anda memiliki data miring atau pencilan, dan pencilan memimpin korelasi Pearson menjadi lebih besar daripada korelasi Spearman. Yaitu, nilai yang sangat tinggi pada X dapat terjadi bersamaan dengan nilai yang sangat tinggi pada Y.
Pertanyaan-pertanyaan Terkait
Lihat juga pertanyaan-pertanyaan sebelumnya tentang perbedaan antara korelasi Spearman dan Pearson:
Bagaimana cara memilih antara korelasi Pearson dan Spearman?
Korelasi Pearson atau Spearman dengan data tidak normal
Contoh R sederhana
Berikut ini adalah simulasi sederhana tentang bagaimana ini dapat terjadi. Perhatikan bahwa kasus di bawah ini melibatkan pencilan tunggal, tetapi Anda dapat menghasilkan efek yang serupa dengan banyak pencilan atau data miring.
Yang memberikan output ini
Analisis korelasi menunjukkan bahwa tanpa outlier Spearman dan Pearson sangat mirip, dan dengan outlier yang agak ekstrim, korelasinya sangat berbeda.
Plot di bawah ini menunjukkan bagaimana memperlakukan data sebagai peringkat menghilangkan pengaruh ekstrim dari pencilan, sehingga menyebabkan Spearman menjadi serupa baik dengan dan tanpa pencilan sedangkan Pearson sangat berbeda ketika pencilan ditambahkan. Ini menyoroti mengapa Spearman sering disebut kuat.
sumber