Tampaknya koefisien korelasi Pearson adalah parametrik dan Spearman rho adalah non-parametrik.
Saya mengalami kesulitan memahami hal ini. Seperti yang saya pahami, Pearson dihitung sebagai dan Spearman dihitung dengan cara yang sama, kecuali kami mengganti semua nilai dengan peringkat mereka.
Wikipedia mengatakan
Perbedaan antara model parametrik dan model non-parametrik adalah bahwa yang pertama memiliki jumlah parameter tetap, sedangkan yang terakhir menumbuhkan jumlah parameter dengan jumlah data pelatihan.
Tapi saya tidak melihat parameter apa pun kecuali sampel itu sendiri. Ada yang mengatakan bahwa tes parametrik mengasumsikan distribusi normal dan selanjutnya mengatakan bahwa Pearson memang mengasumsikan data terdistribusi normal, tetapi saya gagal melihat mengapa Pearson akan membutuhkan itu.
Jadi pertanyaan saya adalah apa arti parametrik dan non-parametrik dalam konteks statistik? Dan bagaimana Pearson dan Spearman cocok di sana?
sumber
Jawaban:
Masalahnya adalah bahwa "nonparametrik" benar-benar memiliki dua makna berbeda akhir-akhir ini. Definisi dalam Wikipedia berlaku untuk hal-hal seperti pemasangan kurva nonparametrik, misalnya melalui splines atau regresi lokal. Arti lain, yang lebih tua, lebih sesuai dengan "bebas distribusi" - yaitu, teknik yang dapat diterapkan terlepas dari asumsi distribusi data. Yang terakhir adalah yang berlaku untuk Spearman rho, karena transformasi peringkat menyiratkan itu akan memberikan hasil yang sama tidak peduli apa distribusi asli Anda.
sumber
Saya pikir satu-satunya alasan mengapa koefisien korelasi Pearson disebut parametrik adalah karena Anda dapat menggunakannya untuk memperkirakan parameter distribusi normal multivarian. misalnya, distribusi normal bivariat memiliki 5 parameter: dua rata-rata, dua varian dan koefisien korelasi. Yang terakhir dapat diperkirakan dengan koefisien korelasi Pearson.
sumber
Jawaban paling sederhana yang saya pikir adalah bahwa tes rho Spearmen menggunakan data ordinal (angka yang dapat diperingkat tetapi tidak memberi tahu Anda tentang interval antara angka-angka misalnya 3 rasa es krim berada di peringkat 1, 2 dan 3 tetapi ini hanya memberi tahu Anda rasa lebih disukai bukan seberapa banyak). Data ordinal tidak dapat digunakan dalam uji parametrik.
Uji r Pearson menggunakan data interval atau rasio (angka yang memiliki interval tetap misalnya detik, kg, mm). 1mm tidak hanya lebih kecil dari 5mm tetapi Anda tahu persis berapa banyak. tipe data ini dapat digunakan dalam uji parametrik.
sumber