Misalkan kita berurusan dengan kumpulan data ini mana adalah variabel kontinu (misalnya Eksponensial) dan adalah distribusi diskrit (misalnya Poisson) untuk . Mari kita mengatakan bahwa adalah korelasi antara dan . Bagaimana seseorang bisa mendefinisikan ?
correlation
count-data
pengguna9292
sumber
sumber
Jawaban:
Saya akan mengatakan setidaknya ada 3 opsi yang layak yang masuk akal untuk Anda:
Untuk menjawab pertanyaan Anda lebih langsung, hitungρ seperti biasa (dengan asumsi maksud Anda koefisien korelasi momen-produk dengan itu) kemungkinan akan memiliki sifat yang Anda harapkan, atau setidaknya itu akan menjadi lebih besar ketika ketergantungan linear antara variabel tumbuh. Namun, uji statistik signifikansi korelasi tidak akan valid karena salah satu asumsi yang diperlukan untuk tes tersebut adalah normalitas bivariat dan itu jelas tidak benar jika salah satu variabel diskrit.
Pengujian signifikansi dengan koefisien korelasi nonparametrik (misalnya Spearman) mungkin dilakukan dan akan mudah untuk menemukan implementasi yang terdokumentasi dengan baik dalam bahasa apa pun.
sumber