Kondisi yang memadai dan diperlukan untuk nilai eigen nol dari matriks korelasi

11

Diberikan variabel acak , dengan distribusi probabilitas , matriks korelasi adalah semi-pasti positif, yaitu nilai eigennya positif atau nol.nXiP(X1,,Xn)Cij=E[XiXj]E[Xi]E[Xj]

Saya tertarik pada kondisi pada yang diperlukan dan / atau cukup untuk untuk memiliki nilai eigen nol. Misalnya, syarat yang memadai adalah bahwa variabel acak tidak independen: untuk beberapa bilangan real . Misalnya, jika , maka adalah vektor eigen dari dengan nilai eigen nol. Jika kita memiliki batasan linear independen pada dari jenis ini, itu akan menyiratkan nol nilai eigen.PCmiuiXi=0uiP(X1,,Xn)=δ(X1X2)p(X2,,Xn)u=(1,1,0,,0)CmXim

Setidaknya ada satu kemungkinan tambahan (tetapi sepele), ketika untuk beberapa (yaitu ), karena dalam hal itu case memiliki kolom dan garis nol: . Karena tidak terlalu menarik, saya mengasumsikan bahwa distribusi probabilitas tidak dalam bentuk itu.a P ( X 1 , , X n ) δ ( X a - E [ X a ] ) C i j C i a = C a i = 0 ,Xa=E[Xa]aP(X1,,Xn)δ(XaE[Xa])CijCia=Cai=0,i

Pertanyaan saya adalah: apakah batasan linear satu-satunya cara untuk menginduksi nol nilai eigen (jika kita melarang pengecualian sepele yang diberikan di atas), atau bisakah kendala non-linear pada variabel acak juga menghasilkan nol nilai eigen ?C

Adam
sumber
1
Menurut definisi, kumpulan vektor yang menyertakan vektor nol bergantung secara linear, jadi kemungkinan tambahan Anda bukanlah sesuatu yang baru atau berbeda. Bisa tolong jelaskan apa yang Anda maksud dengan "memiliki eigenvalue"? Itu terlihat seperti semacam kesalahan ketik. m
Whuber
@whuber: ya, salah ketik. Dikoreksi. Saya pikir dua kondisi berbeda: satu adalah tentang hubungan antara variabel, sedangkan yang lain adalah tentang probabilitas hanya variabel (yaitu ). p(Xa)=δ(XaE(Xa))
Adam
Rumusan pertanyaan Anda membingungkan. Ini terlihat seperti teorema dasar aljabar linier, tetapi referensi untuk variabel acak "independen" menunjukkan bahwa mungkin tentang sesuatu yang lain sama sekali. Apakah benar untuk memahami bahwa setiap kali Anda menggunakan "independen" yang Anda maksudkan dalam arti independensi linear dan bukan dalam arti variabel acak independen (statistik)? Referensi Anda untuk "data yang hilang" bahkan lebih membingungkan, karena itu menunjukkan "variabel acak" Anda mungkin benar-benar berarti hanya kolom dari matriks data. Akan baik untuk melihat makna ini diklarifikasi.
whuber
@whuber: Saya sudah mengedit pertanyaan. Semoga ini lebih jelas.
Adam
Kondisi untuk independensi tidak harus nol (konstanta apa pun akan dilakukan), kecuali jika rata-rata setiap adalah nol. X iiuiXi=0Xi
Sextus Empiricus

Jawaban:

6

Mungkin dengan menyederhanakan notasi kita bisa mengeluarkan ide-ide penting. Ternyata kita tidak perlu melibatkan harapan atau formula rumit, karena semuanya murni aljabar.


Sifat aljabar dari objek matematika

Pertanyaan tersebut menyangkut hubungan antara (1) matriks kovarians dari himpunan terbatas variabel acak dan (2) hubungan linier di antara variabel-variabel tersebut, yang dianggap sebagai vektor .X1,,Xn

Ruang vektor yang dimaksud adalah himpunan semua variabel acak terbatas-varians (pada setiap ruang probabilitas yang diberikan ) modulo subruang variabel hampir pasti konstan, dilambangkan (Yaitu, kami menganggap dua variabel acak dan sebagai vektor yang sama ketika ada nol peluang bahwa berbeda dari yang diharapkan.) Kami hanya berurusan dengan vektor dimensi-terbatas. ruang dihasilkan oleh yang membuat ini menjadi masalah aljabar dan bukan analitik.L 2 ( Ω , P ) / R . X Y X - Y V X i ,(Ω,P)L2(Ω,P)/R.XYXYVXi,

Apa yang perlu kita ketahui tentang varian

V lebih dari sekadar ruang vektor: adalah modul kuadratik, karena dilengkapi dengan varians. Yang perlu kita ketahui tentang varian adalah dua hal:

  1. Variansnya adalah fungsi bernilai skalar dengan properti yang untuk semua vektorQ ( a X ) = a 2 Q ( X ) X .QQ(aX)=a2Q(X)X.

  2. Variansnya adalah nondegenerate.

Yang kedua perlu penjelasan. menentukan "produk titik," yang merupakan bentuk bilinear simetris yang diberikan olehQ

XY=14(Q(X+Y)Q(XY)).

(Hal ini tentu saja tidak lain dari kovarians dari variabel dan ) Vektor dan adalah orthogonal ketika dot produk mereka adalah The komplemen orthogonal dari setiap himpunan vektor terdiri dari semua vektor orthogonal untuk setiap elemen ditulisY . X Y 0. AV A ,XY.XY0.AVA,

A0={vVa.v=0 for all vV}.

Ini jelas merupakan ruang vektor. Ketika , tidak berubah.QV0={0}Q

Izinkan saya untuk membuktikan bahwa varians memang tidak rusak, meskipun mungkin tampak jelas. Misalkan adalah elemen bukan nol dari Ini berarti untuk semuasecara setara,V 0 . X Y = 0 Y V ;XV0.XY=0YV;

Q(X+Y)=Q(XY)

untuk semua vektor Mengambil memberiY = XY.Y=X

4Q(X)=Q(2X)=Q(X+X)=Q(XX)=Q(0)=0

dan dengan demikian Namun, kita tahu (menggunakan Ketimpangan Chebyshev, mungkin) bahwa satu-satunya variabel acak dengan varians nol hampir pasti konstan, yang mengidentifikasi mereka dengan vektor nol dalam QED.V ,Q(X)=0.V,

Menafsirkan pertanyaan

Kembali ke pertanyaan, dalam notasi sebelumnya matriks kovarians dari variabel acak hanyalah array reguler dari semua produk titik mereka,

T=(XiXj).

Ada cara yang baik untuk berpikir tentang : ia mendefinisikan transformasi linear pada dengan cara biasa, dengan mengirim vektor ke dalam vektor yang komponen diberikan oleh aturan perkalian matriksR n x = ( x 1 , ... , x n ) R n T ( x ) = y = ( y 1 , ... , x n ) i thTRnx=(x1,,xn)RnT(x)=y=(y1,,xn)ith

yi=j=1n(XiXj)xj.

The kernel transformasi linear ini adalah ruang bagian mengirimkan ke nol:

Ker(T)={xRnT(x)=0}.

Persamaan sebelumnya menyiratkan bahwa ketika untuk setiapixKer(T),i

0=yi=j=1n(XiXj)xj=Xi(jxjXj).

Karena ini berlaku untuk setiap ia berlaku untuk semua vektor yang direntang oleh : yaitu, itu sendiri. Akibatnya, ketika vektor yang diberikan oleh terletak di Karena adalah nondegenerate, ini berarti Yaitu, menggambarkan ketergantungan linear di antara variabel acak asli.X i V x Ker ( T ) , j x j X j V 0 . j x j X j = 0 x ni,XiVxKer(T),jxjXjV0.jxjXj=0.xn

Anda dapat dengan mudah memeriksa bahwa rantai penalaran ini dapat dibalik:

Ketergantungan linear antara karena vektor berada dalam korespondensi satu-ke-satu dengan elemen-elemen dari kernel T .Xj T.

(Ingat, pernyataan ini masih menganggap sebagai didefinisikan hingga pergeseran konstan di lokasi - yaitu, sebagai elemen --rather daripada sebagai variabel hanya acak.)L 2 ( Ω , P ) / RXjL2(Ω,P)/R

Akhirnya, menurut definisi, sebuah nilai eigen dari adalah setiap skalar yang terdapat nol vektor dengan Ketika adalah nilai eigen, ruang vektor eigen terkait adalah (jelas) kernelλ x T ( x ) = λ x . λ = 0 T .TλxT(x)=λx.λ=0T.


Ringkasan

Kami telah tiba pada jawaban atas pertanyaan: himpunan dependensi linier dari variabel acak, elemen qua dari sesuai satu-ke-satu dengan kernel dari matriks kovarians mereka Hal ini terjadi karena variansnya adalah bentuk kuadrat nondegenerate. Kernel juga merupakan ruang eigens yang terkait dengan nilai eigen nol (atau hanya subruang nol ketika tidak ada nilai eigen nol).L2(Ω,P)/R,T.


Referensi

Saya telah banyak mengadopsi notasi dan beberapa bahasa Bab IV dalam Bahasa Indonesia

Jean-Pierre Serre, Kursus Aritmatika. Springer-Verlag 1973.

whuber
sumber
Wah, bagus sekali! Hanya pertanyaan untuk memastikan bahwa saya mengerti segalanya: ketika Anda menulis " sebagai vektor", Anda tidak bermaksud mengumpulkan variabel acak dalam vektor (yaitu ), atau apakah Anda? Jika saya benar, saya menduga Anda mengumpulkan nilai yang mungkin dari variabel acak ke dalam vektor, sedangkan distribusi probabilitas disembunyikan ke dalam definisi varians, bukan? XjX=(X1,,Xn)Xi
Adam
Saya pikir aspek utama yang tidak begitu jelas adalah sebagai berikut (yang mungkin hanya menunjukkan kurangnya pengetahuan formal saya tentang teori probabilitas): Anda tampaknya menunjukkan bahwa jika ada nilai eigen 0, maka kita memiliki misalnya . Batasan ini tidak merujuk pada distribusi probabilitas , yang tersembunyi di (saya pikir ini adalah titik pintar tentang demonstrasi ini). Tetapi apa artinya memiliki tanpa referensi ke ? Atau apakah itu hanya menyiratkan bahwa , tetapi kemudian bagaimana kita tahu bahwa itu harus merupakan kombinasi linear dari dan dalam fungsi delta ? X1=X2PQX1=X2PPδ(X1X2)X1X2
Adam
Saya khawatir saya tidak mengerti penggunaan "fungsi delta" Anda dalam konteks ini, Adam. Itu sebagian karena saya melihat tidak perlu untuk itu dan sebagian karena notasinya ambigu: apakah itu akan menjadi delta Kronecker atau delta Dirac, misalnya?
whuber
Itu akan menjadi Kronecker atau Dirac tergantung pada variabel (diskrit atau kontinu). Delta ini dapat menjadi bagian dari ukuran integrasi, misalnya saya mengintegrasikan lebih dari 2-oleh-2 matriks (jadi empat variabel nyata , , dan , dengan beberapa bobot (katakanlah ), atau saya mengintegrasikan lebih dari satu sub-grup. Jika itu adalah matriks simetris (menyiratkan misalnya ), saya dapat secara resmi memaksakan bahwa dengan mengalikan dengan akan menjadi kendala linear Contoh kendala non-linear diberikan dalam komentar di bawah jawaban Martijn WeteringsMX1X2X3X4P=exp(tr(M.MT))X2=X3Pδ(X1X2)
Adam
(lanjutan) Pertanyaannya adalah: apa kendala non-linear yang dapat saya tambahkan pada variabel saya dapat menginduksi nilai eigen 0. Dengan jawaban Anda, tampaknya: hanya kendala non-linear yang menyiratkan kendala linear (seperti yang dicontohkan dalam komentar di bawah jawaban Martijn Weterings). Mungkin masalahnya adalah cara saya berpikir tentang masalah ini dari sudut pandang fisikawan, dan saya berjuang untuk menjelaskannya dalam bahasa yang berbeda (saya pikir di sini adalah tempat yang tepat untuk mengajukan pertanyaan ini, bukan fisika. SE).
Adam
5

Independensi linier tidak hanya cukup tetapi juga kondisi yang diperlukan

Untuk menunjukkan bahwa matriks varians-kovarians memiliki nilai eigen yang sama dengan nol jika dan hanya jika variabelnya tidak linier independen, hanya perlu diperlihatkan bahwa "jika matriks memiliki nilai eigen yang sama dengan nol maka variabelnya tidak bebas linear".

Jika Anda memiliki nilai eigen nol untuk maka ada beberapa kombinasi linear (ditentukan oleh vektor eigen )Cij=Cov(Xi,Xj)v

Y=i=1nvi(Xi)

seperti yang

Cov(Y,Y)=i=1nj=1nvivjCov(Xi,Xj)=i=1nvij=1nvjCij=i=1nvi0=0

yang berarti perlu konstan dan dengan demikian variabel harus dijumlahkan menjadi konstanta dan keduanya merupakan konstanta itu sendiri (kasus sepele) atau tidak bebas linear.YXi

- baris pertama dalam persamaan dengan disebabkan oleh properti kovariansCov(Y,Y)

Cov(aU+bV,cW+dX)=acCov(U,W)+bcCov(V,W)+adCov(U,X)+bdCov(V,X)

- langkah dari baris kedua ke baris adalah karena properti dari nilai eigen nol

j=1nvjCij=0


Kendala non-linear

Jadi, karena kendala linear adalah kondisi yang diperlukan (tidak hanya cukup), kendala non-linear hanya akan relevan ketika mereka secara tidak langsung menyiratkan kendala linier (perlu).

Bahkan, ada korespondensi langsung antara vektor eigen terkait dengan nilai eigen nol dan batasan linear.

Cv=0Y=i=1nviXi=const

Jadi kendala non-linear yang mengarah ke nilai eigen nol harus, bersama-sama digabungkan, menghasilkan beberapa kendala linear.


Bagaimana kendala non-linear dapat menyebabkan kendala linear

Contoh Anda dalam komentar dapat menunjukkan hal ini secara intuitif bagaimana kendala non-linear dapat menyebabkan kendala linear dengan membalikkan derivasi. Berikut kendala non-linear

a2+b2=1c2+d2=1ac+bd=0adbc=1

dapat dikurangi menjadi

a2+b2=1c2+d2=1ad=0b+c=0

Anda bisa membalikkan ini. Katakanlah Anda memiliki kendala non-linear plus linear, maka tidak aneh untuk membayangkan bagaimana kita dapat mengganti salah satu kendala linear dengan kendala non-linear, dengan mengisi kendala linear ke dalam kendala non-linear. Misalnya ketika kita mengganti dan dalam bentuk non-linear maka Anda dapat membuat hubungan lain . Dan ketika Anda mengalikan dan maka Anda mendapatkan .a=db=ca2+b2=1adbc=1a=dc=bac=bd

Sextus Empiricus
sumber
Saya kira ini (dan jawaban dengan whuber) adalah jawaban tidak langsung untuk pertanyaan saya (yaitu: "adalah ketergantungan linear satu-satunya cara untuk mendapatkan nilai eigen nol") dengan cara ini: bahkan jika ketergantungan antara variabel acak tidak linear, itu selalu dapat ditulis ulang sebagai ketergantungan linear dengan hanya menulis . Meskipun saya benar-benar mencari cara untuk mengkarakterisasi kemungkinan kendala non-linear itu sendiri, saya kira itu tetap merupakan hasil yang bermanfaat. Y=iνiXi
Adam
Ya, saya tahu ... apa yang saya katakan adalah bahwa jika ada ketergantungan non-linear dan ada nilai eigen nol, maka dengan jawaban Anda, itu berarti bahwa ketergantungan non-linear dapat "diperhitungkan" dalam beberapa cara menjadi ketergantungan linear. Ini adalah versi yang lebih lemah dari apa yang saya cari, tetapi masih ada sesuatu.
Adam
Anda memberi contoh yang tidak berfungsi, yang tidak berarti bahwa itu tidak mungkin terjadi ...
Adam
Berikut ini adalah contoh tandingan dari apa yang Anda katakan (jika Anda pikir tidak, maka mungkin membantu kami menemukan apa yang salah dengan rumusan masalah saya :)): Ambil matriks acak 2-by-2 , dengan kendala non-linear dan . Ketiga kendala non-linier ini dapat ditulis ulang dalam 2 batasan linear, dan satu linear: artinya matriks kovarians memiliki dua vektor eigen. Hapus kendala , dan mereka menghilang. MM.MT=1detM=1detM=1
Adam
M11=X1 , , dan . adalah , , (hanya dua yang independen). Mereka tidak menyiratkan nilai eigen nol. Namun, menambahkan tidak menyiratkan dua vektor eigen dengan 0 nilai eigen. M12=X2M21=X3M22=X4X12+X22=1X32+X42=1X1X3+X2X4=0X1X4X2X3=1
Adam
2

Misalkan memiliki vektor eigen dengan nilai eigen yang sesuai , maka . Dengan demikian, oleh ketidaksetaraan Chebyshev, hampir pasti konstan dan sama dengan . Yaitu, setiap nilai eigen nol sesuai dengan batasan linear, yaitu . Tidak perlu mempertimbangkan kasus khusus.Cv0var(vTX)=vTCv=0vTXvTE[X]vTX=vTE[X]

Dengan demikian, kami menyimpulkan:

"Apakah batasan linear satu-satunya cara untuk menginduksi nol nilai eigen [?]"

Iya.

"dapatkah batasan non-linear pada variabel acak juga menghasilkan nol nilai eigen C?"

Ya, jika mereka menyiratkan kendala linier.

ekvall
sumber
Saya setuju. Saya berharap seseorang dapat lebih spesifik pada jenis kendala non-linear, tetapi saya kira sulit untuk melakukan yang lebih baik jika kita tidak menentukan batasannya.
Adam
2

Marix kovarian dari adalah simetris sehingga Anda dapat mendiagnosisnya sebagai , dengan nilai eigen dalam matriks diagonalMenulis ulang ini sebagai , rhs adalah matriks kovarian QQ , jadi nol nilai eigen pada lhs sesuai dengan kombinasi linear dengan distribusi degenerasi.X C = Q Λ Q T Λ . Λ = Q T C Q Q T X XCXC=QΛQTΛ.Λ=QTCQQTXX

Hasse1987
sumber
Ini adalah deskripsi ringkas yang sangat bagus, tetapi bagaimana kita bisa membuatnya lebih intuitif daripada ? QTCQ=cov(QTX)
Sextus Empiricus