Saya mencoba menghubungkan usia (6-90 thn) dengan kenyaringan suara (dalam dB). Namun, data saya tidak mengandung titik data dalam kisaran 20-50 tahun.
Ukuran korelasi apa yang paling sesuai dengan jeda yang begitu besar, dan mengapa? Saya telah menggunakan Kendall Tau sejauh ini.
Perhatikan bahwa kami tidak berurusan dengan data yang didistribusikan secara bimodal di sini, tetapi dengan kesenjangan data yang hilang dalam rentang usia.
Jawaban:
Buat sebar scatter untuk memeriksa apakah masuk akal untuk menganggap bahwa koefisien korelasi tunggal adalah deskripsi yang memadai tentang hubungan antara variabel.
Misalnya, dalam data (simulasi) ini korelasi untuk usia 6-20 adalah 90%, untuk usia 50+ -70%, dan secara keseluruhan 15%. Dalam situasi seperti ini melaporkan koefisien korelasi tunggal akan sama menipu seperti melaporkan bahwa jumlah rata-rata kaki di antara hewan peliharaan rumah tangga adalah empat ketika setengah dari hewan peliharaan adalah ikan dan setengah lainnya adalah laba-laba ...
Pilihan bagaimana mengekspresikan korelasi adalah masalah sekunder dan bertumpu pada aspek lain dari dataset.
sumber