Saya berencana untuk melakukan studi simulasi di mana saya membandingkan kinerja beberapa teknik korelasi kuat dengan distribusi yang berbeda (condong, dengan outlier, dll.). Dengan robust , maksud saya kasus ideal kuat terhadap a) distribusi yang miring, b) outlier, dan c) ekor yang berat.
Seiring dengan korelasi Pearson sebagai garis dasar, saya berpikir untuk memasukkan langkah-langkah yang lebih kuat:
- Spearman
- Persentase tikungan korelasi (Wilcox, 1994, [1])
- Volume minimum ellipsoid, penentu kovarian minimum (
cov.mve
/cov.mcd
dengancor=TRUE
opsi) - Mungkin, korelasi winorized
Tentu saja ada lebih banyak pilihan (terutama jika Anda memasukkan teknik regresi yang kuat juga), tetapi saya ingin membatasi diri pada pendekatan yang kebanyakan digunakan / kebanyakan menjanjikan.
Sekarang saya punya tiga pertanyaan (jangan hanya menjawab satu pertanyaan):
- Apakah ada metode korelasional kuat lainnya yang bisa / harus saya masukkan?
- Teknik korelasi kuat mana yang benar - benar digunakan di bidang Anda? (Berbicara untuk penelitian psikologis: Kecuali Spearman , saya belum pernah melihat yang kuat teknik korelasi luar dari kertas teknis Bootstrap semakin lebih dan lebih populer, tetapi statistik yang kuat lain yang lebih atau kurang tidak ada sejauh ini.).
- Apakah sudah ada perbandingan sistematis dari teknik korelasi berganda yang Anda ketahui?
Juga merasa bebas untuk mengomentari daftar metode yang diberikan di atas.
[1] Wilcox, RR (1994). Persentase tikungan koefisien korelasi. Psychometrika , 59, 601-616.
sumber
Kendall's tau sangat banyak digunakan dalam teori kopula, mungkin karena itu adalah hal yang sangat alami untuk dipertimbangkan untuk kopula archimedean. Plot kumulatif Kendall tau diperkenalkan oleh Genest dan Rivest sebagai cara untuk memilih model di antara keluarga kumbang bivariat.
Link ke makalah Genest Rivest (1993)
sumber
Beberapa ukuran korelasi yang kuat adalah:
Koefisien Korelasi Peringkat Spearman
Koefisien Korelasi Signum (Blomqvist)
Kendall's Tau
Koefisien Korelasi Absolut Bradley
Koefisien Korelasi Shevlyakov
Referensi:
• Blomqvist, N. (1950) "Pada Ukuran Ketergantungan antara Dua Variabel Acak", Annals of Mathematical Statistics, 21 (4): 593-600. • Bradley, C. (1985) "The Absolute Correlation", The Mathematic Gazette, 69 (447): 12-17. • Shevlyakov, GL (1997) "On Estimasi Kuat Koefisien Korelasi", Jurnal Ilmu Matematika, 83 (3): 434-438. • Spearman, C. (1904) "Bukti dan Pengukuran Asosiasi antara Dua Hal", American Journal of Psychology, 15: 88-93.
sumber
Midcorrelation biweight diimplementasikan dalam R (sangat cepat) melalui WGCNA dan Python (tidak begitu cepat) melalui astropi . Itulah tujuan saya untuk analisis jaringan.
Untuk data komposisi yang jarang, ada juga SparCC dan FastSpar
sumber