Terikat untuk korelasi tiga variabel acak

28

Ada tiga variabel acak, . Tiga korelasi antara ketiga variabel itu sama. Itu adalah,x,y,z

ρ=cor(x,y)=cor(x,z)=cor(y,z)

Apa ketat terikat Anda dapat memberikan untuk ?ρ

pengguna1352399
sumber
1
Agaknya dengan "pho", maksudmu rho ( ). Namun, pertanyaan Anda tidak jelas. Apa yang Anda maksud dengan "Apa batasan paling ketat yang bisa Anda berikan"? ρ
gung - Reinstate Monica
Nah nama variabelnya hanya tiruan. Dengan ikatan yang paling ketat, maksud saya kira-kira seperti [-1, 1] untuk suatu korelasi, tetapi ini jelas bukan batas yang paling ketat.
user1352399
Apakah maksud Anda rho = cor (x, y) = cor (x, z) = cor (y, z), dan berapa batas untuk rho?
user31264
Ya maksud saya rho = cor (x, y) = cor (x, z) = cor (y, z) dan berapa batas untuk rho. Dilip, dapatkah Anda mengatakan bahwa rho harus non-negatif, yaitu> = 0?
user1352399
1
Buku teks yang akan dikutip untuk ini adalah Seber & Lee "Analisis Regresi Linier" (Setidaknya itu dalam edisi pertama ...)
kjetil b halvorsen

Jawaban:

29

Umum korelasi dapat memiliki nilai tapi tidak . Jika , maka tidak dapat sama dengan tetapi sebenarnya . Nilai terkecil dari korelasi umum dari tiga variabel acak adalah . Lebih umum, korelasi umum minimum dari variabel acak adalah ketika, dianggap sebagai vektor, mereka berada pada simpul simpleks (dimensi ) dalam ruang -dimensi.ρ+1-1ρX,Y=ρX,Z=-1ρY,Z-1+1-12n-1n-1n-1n

Pertimbangkan varians dari penjumlahan unit varians variabel acak . Kami memiliki mana adalah rata - rata nilai dari koefisien korelasi. Tetapi karena , kita dengan mudah mendapatkan dari yang X i var ( n i = 1 X i )nXsaya ˉ ρ ( n

var(saya=1nXsaya)=saya=1nvar(Xsaya)+saya=1njsayancov(Xsaya,Xj)=n+saya=1njsayanρXsaya,Xj(1)=n+n(n-1)ρ¯
ρ¯ var(iXi)0(1) ˉ ρ-1(n2)var(sayaXsaya)0(1)
ρ¯-1n-1.

Jadi, nilai rata-rata koefisien korelasi setidaknya . Jika semua koefisien korelasi memiliki yang sama nilai , maka mereka rata-rata juga sama dan jadi kita harus yang Apakah mungkin untuk memiliki variabel acak dengan nilai korelasi umum sama dengan ? Iya nih. Misalkan adalah variabel acak unit- yang tidak berkorelasi dan set . Kemudian, , sementara ρρρ-1-1n-1ρρρ-1

ρ-1n-1.
ρ XiYi=Xi-1-1n-1Xsaya E[Yi]=0var(Yi)= ( n - 1Ysaya=Xsaya-1nj=1nXj=Xsaya-X¯E[Ysaya]=0 cov(Yi,Yj)=-2(n-1
var(Ysaya)=(n-1n)2+(n-1)(1n)2=n-1n
dan memberi Jadi adalah variabel acak yang mencapai nilai korelasi umum minimum . Perhatikan, secara kebetulan, bahwa , dan, yang dianggap sebagai vektor, variabel acak terletak pada hyperplane -dimensi ρYi,Yj=cov(Yi,Yj)
cov(Ysaya,Yj)=-2(n-1n)(1n)+(n-2)(1n)2=-1n
Yi-1
ρYsaya,Yj=cov(Ysaya,Yj)var(Ysaya)var(Yj)=-1/n(n-1)/n=-1n-1.
YsayaiYi=0(n-1)n-1n-1sayaYsaya=0(n-1)nruang -dimensi.
Dilip Sarwate
sumber
25

Ikatan seketat mungkin adalah . -1/2ρ1 Semua nilai tersebut dapat benar-benar muncul - tidak ada yang mustahil.

Untuk menunjukkan tidak ada yang khusus mendalam atau misterius tentang hasilnya, jawaban ini pertama-tama menyajikan solusi yang sepenuhnya mendasar, hanya membutuhkan fakta yang jelas bahwa varians - sebagai nilai yang diharapkan dari kotak - harus non-negatif. Ini diikuti oleh solusi umum (yang menggunakan fakta-fakta aljabar yang sedikit lebih canggih).

Solusi dasar

Varian dari setiap kombinasi linear harus non-negatif. x,y,z Biarkan varians dari variabel-variabel ini masing-masing menjadi dan . Semuanya bukan nol (karena kalau tidak beberapa korelasi tidak akan didefinisikan). Menggunakan sifat-sifat dasar varian yang dapat kita hitungυ 2σ2,τ2,kamu2

0Var(αx/σ+βy/τ+γz/kamu)=α2+β2+γ2+2ρ(αβ+βγ+γα)

untuk semua bilangan real .(α,β,γ)

Dengan asumsi , sedikit manipulasi aljabar menyiratkan ini setara denganα+β+γ0

-ρ1-ρ13((α2+β2+γ2)/3(α+β+γ)/3)2.

Istilah kuadrat di sisi kanan adalah rasio dua sarana daya . The ketimpangan kekuasaan-rata SD (dengan bobot ) menegaskan rasio yang tidak dapat melebihi (dan akan sama ketika ). Aljabar sedikit lebih berarti( 1 / 3 , 1 / 3 , 1 / 3 ) 1 1 α = β = γ 0(α,β,γ)(1/3,1/3,1/3)11α=β=γ0

ρ-1/2.

Contoh eksplisit dari bawah ini (melibatkan trivariate variabel Normal ) menunjukkan bahwa semua nilai tersebut, , sebenarnya muncul sebagai korelasi. Contoh ini hanya menggunakan definisi multivarian Normals, tetapi sebaliknya tidak memanggil hasil Kalkulus atau Aljabar Linier.( x , y , z ) - 1 / 2 ρ 1n=3(x,y,z)-1/2ρ1

Solusi umum

Ikhtisar

Matriks korelasi apa pun adalah matriks kovarians dari variabel acak terstandarisasi, di mana - seperti semua matriks korelasi - haruslah positif semifinal. Secara setara, nilai eigennya adalah non-negatif. Ini memberlakukan kondisi sederhana pada : tidak boleh kurang dari (dan tentu saja tidak boleh melebihi ). Sebaliknya, apapun seperti benar-benar sesuai dengan matriks korelasi beberapa distribusi trivariate, membuktikan batas ini adalah ketat mungkin.- 1 / 2 1 ρρ-1/21ρ


Penurunan kondisi padaρ

Pertimbangkan oleh matriks korelasi dengan semua nilai-nilai off-diagonal sama untuk(Pertanyaannya menyangkut kasus tetapi generalisasi ini tidak lebih sulit untuk dianalisis.) Sebut saja Menurut definisi, adalah nilai eigen asalkan ada vektor bukan nol sedemikian rupa sehinggan ρ . n = 3 , C ( ρ , n ) . λ x λnnρ.n=3,C(ρ,n).λxλ

C(ρ,n)xλ=λxλ.

Nilai eigen ini mudah ditemukan dalam kasus ini, karena

  1. Membiarkan , hitung itu1=(1,1,,1)

    C(ρ,n)1=(1+(n1)ρ)1.
  2. Membiarkan dengan hanya di tempat (untuk ), hitung itu1 j th j=2,3,...,nyj=(1,0,,0,1,0,,0)1jthj=2,3,,n

    C(ρ,n)yj=(1ρ)yj.

Karena vektor eigen ditemukan sejauh span penuh dimensi ruang (bukti: baris yang mudah pengurangan menunjukkan nilai absolut dari determinan mereka sama , yang merupakan nol), mereka merupakan dasar dari semua vektor eigen. Karena itu, kami telah menemukan semua nilai eigen dan menentukan bahwa keduanya atau (yang terakhir dengan multiplisitas ). Selain ketidaksamaan yang terkenal puas dengan semua korelasi, non-negatif dari nilai eigen pertama lebih lanjut menyiratkann n 1 + ( n - 1 ) ρ 1 - ρ n - 1 - 1 ρ 1nnn1+(n1)ρ1ρn11ρ1

ρ1n1

sedangkan non-negatif dari nilai eigen kedua tidak memaksakan kondisi baru.


Bukti kecukupan kondisi

Implikasinya bekerja di kedua arah: asalkan matriks adalah non-negatif-pasti dan karenanya merupakan matriks korelasi yang valid. Sebagai contoh, ini adalah matriks korelasi untuk distribusi multinormal. Secara khusus, tulisC ( ρ , n )1/(n1)ρ1,C(ρ,n)

Σ(ρ,n)=(1+(n1)ρ)Inρ(1ρ)(1+(n1)ρ)11

untuk kebalikan dari ketika Misalnya, ketika- 1 / ( n - 1 ) < ρ < 1. n = 3C(ρ,n)1/(n1)<ρ<1.n=3

Σ(ρ,3)=1(1ρ)(1+2ρ)(ρ+1ρρρρ+1ρρρρ+1).

Biarkan vektor variabel acak memiliki fungsi distribusi(X1,X2,,Xn)

fρ,n(x)=exp(12xΣ(ρ,n)x)(2π)n/2((1ρ)n1(1+(n1)ρ))1/2

di mana . Misalnya, ketika ini sama dengann = 3x=(x1,x2,,xn)n=3

1(2π)3(1-ρ)2(1+2ρ)exp(-(1+ρ)(x2+y2+z2)-2ρ(xy+yz+zx)2(1-ρ)(1+2ρ)).

Matriks korelasi untuk variabel acak ini adalahC ( ρ , n ) .nC(ρ,n).

Angka

Kontur fungsi kerapatan Dari kiri ke kanan, . Perhatikan bagaimana kerapatan bergeser dari terkonsentrasi di dekat bidang menjadi terkonsentrasi di dekat garis .ρ = - 4 / 10 , 0 , 4 / 10 , 8 / 10 x + y + z = 0 x = y = zfρ,3.ρ=-4/10,0,4/10,8/10x+y+z=0x=y=z

Kasus khusus dan juga dapat diwujudkan dengan distribusi yang menurun ; Saya tidak akan masuk ke rincian kecuali untuk menunjukkan bahwa dalam kasus sebelumnya distribusi dapat dianggap didukung pada hyperplane , di mana itu adalah jumlah dari mean- didistribusikan secara identik- Distribusi normal, sedangkan dalam kasus terakhir (korelasi positif sempurna) didukung pada baris yang dihasilkan oleh , di mana ia memiliki mean- distribusi Normal.ρ = 1 x . 1 = 0 0 1 0ρ=-1/(n-1)ρ=1x.1=0010


Lebih lanjut tentang non-kemunduran

Tinjauan analisis ini memperjelas bahwa matriks korelasi memiliki peringkat dan memiliki peringkat dari (karena hanya satu vektor eigen yang memiliki nilai eigen bukan nol). Untuk , ini membuat matriks korelasi menurun dalam kedua kasus. Jika tidak, keberadaan invers membuktikannya tidak rusak.C(-1/(n-1),n)n-1C(1,n)1n2Σ(ρ,n)

whuber
sumber
20

Matriks korelasi Anda adalah

(1ρρρ1ρρρ1)

Matriksnya adalah semidefinit positif jika semua anak di bawah umur utama adalah non-negatif. Anak di bawah umur utama adalah penentu dari blok "utara-barat" dari matriks, yaitu 1, penentu

(1ρρ1)

dan penentu matriks korelasi itu sendiri.

1 jelas positif, minor utama kedua adalah , yang tidak negatif untuk korelasi yang dapat diterima . Penentu seluruh matriks korelasi adalah1-ρ2ρ[-1,1]

2ρ3-3ρ2+1.

Plot menunjukkan penentu fungsi pada rentang korelasi yang dapat diterima . [-1,1]masukkan deskripsi gambar di sini

Anda melihat fungsi ini bukan negatif atas kisaran yang diberikan oleh @stochazesthai (yang juga bisa Anda periksa dengan mencari akar persamaan determinan).

Christoph Hanck
sumber
Bukankah kita mengasumsikan dalam jawaban Anda bahwa ? Kenapa kita bisa? VSebuahr()=1
Seorang pria tua di laut.
1
@Anold Anda sepertinya membaca "kovarians" di mana "korelasi" ditulis.
whuber
6

Terdapat variabel acak , dan dengan korelasi berpasangan jika dan hanya jika matriks korelasi semidefinite positif. Ini hanya terjadi pada .Y Z ρ X Y = ρ Y Z = ρ X Z = ρ ρ [ - 1XYZρXY=ρYZ=ρXZ=ρρ[-12,1]

stochazesthai
sumber
2
dapatkah Anda menjelaskannya dengan sangat sederhana?
Elizabeth Susan Joseph
1
Saya tidak berpikir ada penjelasan yang tidak membutuhkan pengetahuan tentang aljabar matriks. Saya sarankan Anda untuk melihat halaman Wikipedia ( en.wikipedia.org/wiki/… ).
stochazesthai
4
Saya menemukan penjelasan yang hanya membutuhkan aljabar dasar (tingkat sekolah menengah) dan telah memasukkannya dalam jawaban saya.
whuber