Seperti yang saya pahami, kita bisa mendapatkan korelasi dengan menormalkan kovarians menggunakan persamaan
dimana adalah standar deviasiXi.
Kekhawatiran saya adalah bagaimana jika standar deviasi sama dengan nol? Apakah ada syarat yang menjamin tidak boleh nol?
Terima kasih.
correlation
standard-deviation
covariance
chepukha
sumber
sumber
Jawaban:
Memang benar, jika salah satu SD Anda adalah 0, persamaan itu tidak terdefinisi. Namun, cara yang lebih baik untuk memikirkan ini adalah bahwa jika salah satu SD Anda adalah 0, tidak ada korelasi. Dalam istilah konseptual yang longgar, sebuah korelasi memberi tahu Anda tentang bagaimana satu variabel bergerak ketika variabel lain bergerak. SD 0 menyiratkan bahwa variabel tidak 'bergerak'. Anda harus memiliki vektor konstanta, seperti
rep(constant, n_times)
.sumber
Hal lain yang perlu dipikirkan adalah asumsi yang mendasari ketika kita berbicara tentang sarana dan standar deviasi, dan korelasi.
Jika kita berbicara tentang sampel data, satu asumsi umum adalah bahwa data tersebut (setidaknya kira-kira) terdistribusi secara normal, atau dapat ditransformasikan sedemikian rupa (misalnya melalui transformasi log). Jika Anda mengamati standar deviasi nol, ada dua skenario: apakah standar deviasi sebenarnya bukan nol, tetapi sangat kecil, dan oleh karena itu dataset yang Anda miliki memiliki sampel yang semuanya pada nilai rata-rata (ini bisa, misalnya, terjadi jika Anda mengukur data pada tingkat presisi kasar); atau model tidak ditentukan dengan spesifik.
Dalam skenario kedua ini, standar deviasi, dan akibatnya korelasinya, adalah ukuran yang tidak berarti.
Secara umum, distribusi yang mendasarinya harus memiliki momen kedua yang terbatas, dan oleh karena itu deviasi standar yang tidak nol, agar korelasi menjadi konsep yang valid.
sumber
Korelasi adalah kosinus sudut antara dua vektor. Mengatakan bahwa deviasi standar untuk Y adalah nol sama dengan mengatakan bahwa vektor Y-mean (Y) adalah nol (atau, lebih keras, bahwa ia mewakili nol dalam ruang vektor yang sesuai). Jadi pertanyaannya menjadi "Apa yang bisa dikatakan tentang sudut (cosinus dari) antara vektor nol dan vektor X-mean (X)?". Lebih umum, dalam ruang vektor apa pun dengan produk dalam, apa yang dimaksud dengan sudut antara vektor nol dan beberapa vektor lainnya? Hanya ada satu jawaban untuk ini, menurut saya, dan itu adalah bahwa konsep "sudut" dalam situasi ini tidak ada artinya, dan konsep korelasi dalam situasi ini tidak ada artinya.
sumber
Penafian, saya menyadari bahwa sudah ada jawaban kualitas yang diterima, jadi ini harus menjadi respons, tetapi saya tidak memiliki poin pengalaman untuk mengizinkannya. @Dilip menyebutkan bahwa Anda dapat mendefinisikan korelasi sebagai 0 untuk konvensi, tetapi ini tampaknya bermasalah karena akan memiliki interpretasi yang sangat berbeda dari korelasi yang benar-benar nol (dengan SD yang bukan nol). Pertanyaan aslinya mengatakan "jika SD dari satu variabel adalah nol". Jika kita hanya berhenti dan memikirkan definisi 'variabel' maka kita mendapatkan jalan yang jauh lebih langsung ke jawabannya. Variabel dengan 0 SD bukan variabel sama sekali, itu adalah konstan. Jadi dalam hal ini Anda tidak memiliki dua variabel, jadi secara konseptual tidak masuk akal untuk mendefinisikan korelasi sama sekali.
sumber