Apakah mungkin 3 vektor memiliki semua korelasi berpasangan negatif?

16

Dengan tiga vektor a , b , dan c , mungkinkah korelasi antara a dan b , a dan c , dan b dan c semuanya negatif? Yaitu apakah ini mungkin?

corr(a,b)<0corr(a,c)<0corr(b,c)<0
Antti A
sumber
3
Korelasi negatif berarti, secara geometris, bahwa vektor terpusat saling membuat sudut tumpul. Anda seharusnya tidak memiliki masalah menggambar konfigurasi tiga vektor di pesawat yang memiliki properti ini.
Whuber
Mereka tidak dapat sepenuhnya berkorelasi negatif ( ρ=1 ), tetapi secara umum mungkin ada beberapa korelasi negatif, sekali lagi batas ditetapkan oleh korelasi lainnya.
karakfa
2
@whuber Komentar Anda tampaknya bertentangan dengan jawaban Heikki Pulkkinen, yang mengklaim bahwa mustahil bagi vektor di dalam pesawat. Jika Anda mendukungnya, Anda harus mengubah komentar Anda menjadi jawaban.
RM
2
@RM Tidak ada kontradiksi antara whuber dan Heikki. Pertanyaan ini menanyakan tentang data matriks X dari n×3 ukuran. Biasanya kita akan berbicara tentang n titik data dalam 3 dimensi, tetapi Q ini berbicara tentang tiga "vektor" dalam dimensi n . Heikki mengatakan bahwa semua korelasi negatif tidak dapat terjadi jika n=2 (memang, dua poin setelah pemusatan selalu berkorelasi sempurna, sehingga korelasi harus ±1 dan tidak semua 1 ). Whuber mengatakan bahwa 3 vektor dalam n dimensi dapat secara efektif terletak pada subruang 2 dimensi (yaitu Xadalah peringkat 2) dan menyarankan untuk membayangkan logo Mercedes.
Amuba mengatakan Reinstate Monica
1
Terkait: Terikat untuk korelasi tiga variabel acak . (cc, @amoeba)
gung - Reinstate Monica

Jawaban:

19

Dimungkinkan jika ukuran vektornya 3 atau lebih besar. Sebagai contoh

a=(1,1,1)b=(1,9,3)c=(2,3,1)

Korelasi adalah

cor(a,b)=0.80...cor(a,c)=0.27...cor(b,c)=0.34...

Kita dapat membuktikan bahwa untuk vektor ukuran 2 ini tidak dimungkinkan:

cor(a,b)<02(iaibi)(iai)(ibi)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)(a1+a2)(b1b2)<02(a1b1+a2b2)a1b1+a1b2+a2b1+a2b2<0a1b1+a2b2a1b2+a2b1<0a1(b1b2)+a2(b2b1)<0(a1a2)(b1b2)<0

The formula makes sense: if a1 is larger than a2, b1 has to be larger than b1 to make the correlation negative.

Similarly for correlations between (a,c) and (b,c) we get

(a1a2)(c1c2)<0(b1b2)(c1c2)<0

Clearly, all of these three formulas can not hold in the same time.

Heikki Pulkkinen
sumber
3
Another example of something unexpected that only happens in dimension three or higher.
nth
1
With vectors of size 2, correlations are usually ±1 (straight line through two points), and you cannot have three correlations of 1 with three vectors of any size
Henry
9

Yes, they can.

Suppose you have a multivariate normal distribution XR3,XN(0,Σ). The only restriction on Σ is that it has to be positive semi-definite.

So take the following example Σ=(10.20.20.210.20.20.21)

Its eigenvalues are all positive (1.2, 1.2, 0.6), and you can create vectors with negative correlation.

Kozolovska
sumber
7

let's start with a correlation matrix for 3 variables

Σ=(1pqp1rqr1)

non-negative definiteness creates constraints for pairwise correlations p,q,r which can be written as

pqrp2+q2+r212

For example, if p=q=1, the values of r is restricted by 2rr2+1, which forces r=1. On the other hand if p=q=12, r can be within 2±34 range.

Answering the interesting follow up question by @amoeba: "what is the lowest possible correlation that all three pairs can simultaneously have?"

Let p=q=r=x<0, Find the smallest root of 2x33x2+1, which will give you 12. Perhaps not surprising for some.

A stronger argument can be made if one of the correlations, say r=1. From the same equation 2pqp2+q2, we can deduce that p=q. Therefore if two correlations are 1, third one should be 1.

karakfa
sumber
2

A simple R function to explore this:

f <- function(n,trials = 10000){
  count <- 0
  for(i in 1:trials){
    a <- runif(n)
    b <- runif(n)
    c <- runif(n)
    if(cor(a,b) < 0 & cor(a,c) < 0 & cor(b,c) < 0){
      count <- count + 1
    }
  }
  count/trials
}

As a function of n, f(n) starts at 0, becomes nonzero at n = 3 (with typical values around 0.06), then increases to around 0.11 by n = 15, after which it seems to stabilize:

enter image description here So, not only is it possible to have all three correlations negative, it doesn't seem to be terribly uncommon (at least for uniform distributions).

John Coleman
sumber