Kapan saya harus menggunakan masing-masing metode ini untuk menghitung korelasi?

8

Saya menggunakan R untuk analisis data. R menyediakan corrfungsi untuk menghitung korelasi. Fungsi ini menyediakan tiga pendekatan / algoritma yang berbeda untuk memperkirakan yang corrmana adalah Pearson, Spearman dan Kendall. Kapan saya harus menggunakan masing-masing metode ini? Faktor apa yang menentukan metode mana yang harus digunakan?

asheeshr
sumber
Meskipun ini dalam konteks R, pertanyaannya memang tentang perbedaan antara tiga ukuran statistik. Saya akan mengatakan bermigrasi juga.
Sean Owen
1
Pertanyaan ini sudah ditanyakan di stats.stackexchange.com/questions/45897/… (tetapi belum mendapatkan jawaban). Situs kami memiliki materi yang luas tentang korelasi, terutama membandingkan koefisien Pearson dan Spearman: lihat hasil pencarian di stats.stackexchange.com/… .
whuber

Jawaban:

10

Koefisien momen-produk Pearson (parameter pearson) mengukur korelasi linier antar variabel. Oleh karena itu sangat tepat bila korelasi Anda yang dicurigai adalah linier, yang dapat diperiksa secara visual dengan plot.

Koefisien Kendall Tau (kendall paramter) dan koefisien korelasi Spearman (parameter spearman) adalah ukuran korelasi peringkat. Jadi korelasi antara kedua variabel tidak perlu linear. Metode spearman pada dasarnya adalah metode pearson, tetapi diterapkan pada jajaran nilai-nilai (peringkat nilai diberikan oleh posisi itu setelah mengurutkan nilai-nilai). Metode kendal dibangun pada dasarnya sebagai statistik dalam bentuk ransum antara jumlah tambahan pasangan terurut dan jumlah total pasangan. Untuk metode kendal, karena dibangun sebagai statistik, seseorang dapat membangun juga menggunakannya dalam kerangka pengujian hipotesis, dengan semua manfaatnya (disebut tes tau).

Semua metode ini adalah instrumen yang digunakan untuk menyimpulkan sesuatu tentang dependensi antara variabel acak. Lihat lebih banyak di halaman khusus Wikipedia yang didedikasikan untuk Korelasi dan Ketergantungan

rapaio
sumber
Bukankah benar juga bahwa Spearman dan Pearson juga harus identik untuk hubungan linier jadi jika ragu Anda dapat menggunakan Spearman dan yakinlah bahwa Anda tidak akan terlempar jika korelasinya non-linear?
cwharland
1
Sejujurnya, saya tidak tahu apakah mereka sama dalam hubungan linier. Ini yakin bahwa pearson pada peringkat adalah spearman. Namun, selama transformasi untuk menentukan peringkat beberapa hal terjadi: pearson menjadi lebih kuat untuk outlier, kovarians diubah secara tidak dapat diperbaiki, pearson menggabungkan kemungkinan noise yang tidak independen (mungkin dihasilkan oleh perancu). Secara umum saya menggunakan pearson untuk inferensi berbasis linear, spearman untuk memeriksa apakah ada hal lain selain linearitas, plus untuk ordinals (yang masuk akal hanya untuk spearman).
rapaio
@ cwharland Bahkan mereka cenderung tidak sama untuk hubungan linier. Dalam sampel normal bivariat berkorelasi (yang memiliki hubungan linear yang Anda sarankan) korelasi Spearman biasanya (baik rata-rata dan dalam hal median distribusinya) lebih dekat ke 0 daripada Pearson. Keduanya bias, tetapi Pearson kurang begitu.
Glen_b -Reinstate Monica