Ukuran yang tepat untuk menemukan matriks kovariansi terkecil

10

Dalam buku teks yang saya baca mereka menggunakan ketajaman positif (semi-positive definiteness) untuk membandingkan dua matriks kovarian. Gagasan bahwa jika AB adalah pd maka lebih kecil dari . Tapi aku berjuang untuk mendapatkan intuisi dari hubungan ini?BA

Ada utas serupa di sini:

/math/239166/what-is-the-intuition-for-using-definiteness-to-compare-matrices

Apa intuisi untuk menggunakan ketetapan untuk membandingkan matriks?

Meskipun jawabannya bagus, mereka tidak benar-benar membahas intuisi.

Ini adalah contoh yang saya anggap membingungkan:

[1612129][1224]

sekarang di sini penentu perbedaannya adalah -25 sehingga hubungannya bukan pd atau bahkan psd dan matriks pertama tidak lebih besar dari yang pertama?

Saya hanya ingin membandingkan dua 3 * 3 matriks kovarian untuk melihat mana yang terkecil? Tampaknya lebih intuitif bagi saya untuk menggunakan sesuatu seperti norma euclidean untuk membandingkannya? Namun ini berarti bahwa matriks pertama di atas lebih besar daripada matix kedua. Selain itu saya hanya pernah melihat kriteria pd / psd yang digunakan untuk membandingkan matriks kovarians.

Adakah yang bisa menjelaskan mengapa pd / psd lebih baik daripada menggunakan ukuran lain seperti norma euclidean?

Saya juga memposting pertanyaan ini di forum matematika (tidak yakin apa yang terbaik) berharap ini tidak melanggar aturan apa pun.

/math/628135/comparing-two-covariance-matrices

Baz
sumber
2
Anda mungkin ingin membaca ini di mana intuisi di balik kepastian positif (semi) dipertimbangkan. Ketika Anda membandingkan 2 varian adan b, jika a-bpositif maka kami akan mengatakan bahwa setelah menghapus variabilitas bkeluar dari asana tetap ada beberapa variabilitas "nyata" yang tersisa a. Demikian juga kasus varians multivariat (= matriks kovarians) Adan B. Jika A-Bpositif pasti maka itu berarti bahwa A-Bkonfigurasi vektor "nyata" dalam ruang euclidean: dengan kata lain, setelah mengeluarkan Bdari A, yang terakhir masih merupakan variabilitas yang layak.
ttnphns
2
Apa yang Anda maksud dengan "terkecil" dari dua matriks kovarian?
whuber
Halo, matriks kovarian berhubungan dengan estimator yang bersaing, saya ingin memilih estimator yang memiliki varian terkecil. (Apakah ini memperjelas hal-hal?)
Baz
2
Baz: Lalu mengapa tidak membandingkan varians dari estimator secara langsung?
Glen_b -Reinstate Monica
Hai ada metode yang ditetapkan, ekspresi untuk apa yang mereka sebut varians (yang termasuk kovarian) diberikan. Namun bahkan jika saya membandingkan varian saja ini masih akan melibatkan membandingkan nilai-nilai vektor yang akan memiliki masalah yang sama dengan membandingkan nilai-nilai matriks?
Baz

Jawaban:

8

Urutan matriks yang Anda rujuk dikenal sebagai urutan Loewner dan merupakan urutan parsial yang banyak digunakan dalam studi matriks pasti positif. Perlakuan panjang buku dari geometri pada berbagai matriks positif-pasti (posdef) ada di sini .

Pertama-tama saya akan mencoba menjawab pertanyaan Anda tentang intuisi . A (simetris) matriks A adalah posdef jika cTAc0 untuk semua cRn . Jika X adalah variabel acak (rv) dengan matriks kovarian A , maka adalah (sebanding dengan) proyeksi pada beberapa subruang satu-redup, dan . Menerapkan ini ke di Q Anda, pertama: itu adalah matriks kovarians, kedua: Variabel acak dengan proyek-proyek matriks kovar di semua arahcTXVar(cTX)=cTAcABBAdengan varians lebih kecil dari rv dengan kovarians matriks . Ini membuatnya secara intuitif jelas bahwa pemesanan ini hanya bisa sebagian, ada banyak rv yang akan diproyeksikan ke arah yang berbeda dengan varian yang sangat berbeda. Proposal Anda tentang beberapa norma Euclidean tidak memiliki interpretasi statistik yang alami.A

"Contoh membingungkan" Anda membingungkan karena kedua matriks memiliki nol penentu. Jadi untuk masing-masing, ada satu arah (vektor eigen dengan nilai eigen nol) di mana mereka selalu memproyeksikan ke nol . Tetapi arah ini berbeda untuk kedua matriks, oleh karena itu mereka tidak dapat dibandingkan.

Urutan Loewner didefinisikan sedemikian rupa sehingga , lebih pasti positif daripada , jika adalah posdef. Ini adalah urutan parsial, untuk beberapa matriks posdef, baik maupun tidak posdef. Contohnya adalah: Salah satu cara menunjukkan ini secara grafis adalah menggambar plot dengan dua elips, tetapi berpusat pada asal, terkait dengan cara standar dengan matriks (maka jarak radial di setiap arah sebanding dengan varian memproyeksikan ke arah itu):ABBABABAAB

A=(10.50.51),B=(0.5001.5)

Dua matriks posdef ditampilkan sebagai elips

Dalam kasus ini, kedua elips itu kongruen, tetapi diputar secara berbeda (sebenarnya sudutnya 45 derajat). Ini sesuai dengan fakta bahwa matriks danAB memiliki nilai eigen yang sama, tetapi vektor eigen diputar.

Karena jawaban ini sangat tergantung pada sifat elips, berikut ini Apa intuisi di balik distribusi Gaussian bersyarat? menjelaskan elips secara geometris, dapat membantu.

Sekarang saya akan menjelaskan bagaimana elips yang terkait dengan matriks didefinisikan. Matriks posdef mendefinisikan bentuk kuadratik . Ini dapat diplot sebagai fungsi, grafik akan menjadi kuadratik. Jika maka grafik akan selalu berada di atas grafik . Jika kita memotong grafik dengan bidang horizontal pada ketinggian 1, maka potongan akan menggambarkan elips (yang sebenarnya cara mendefinisikan elips). dipotong ini diberikan oleh persamaan AQA(c)=cTAcABQBQA

QA(c)=1,QB(c)=1
dan kita melihat bahwaABsesuai dengan elips B (sekarang dengan interior) terkandung dalam elips A. Jika tidak ada pesanan, tidak akan ada penahanan. Kami mengamati bahwa urutan inklusi berlawanan dengan urutan parsial Loewner, jika kami tidak suka bahwa kami dapat menggambar elips dari invers. Ini karena setara dengan . Tapi saya akan tetap dengan elips seperti yang didefinisikan di sini.ABB1A1

Elips dapat digambarkan dengan semiax dan panjangnya. Kita hanya akan membahas angka di sini, karena mereka adalah yang dapat kita gambar ... Jadi kita membutuhkan dua sumbu utama dan panjangnya. Ini dapat ditemukan, seperti dijelaskan di sini dengan komposisi eigend dari matriks posdef. Kemudian sumbu utama diberikan oleh vektor eigen, dan panjangnya dapat dihitung dari nilai eigen dengan Kita juga dapat melihat bahwa area elips yang mewakili adalah2×2a , b λ 1 , λ 2 a = a,bλ1,λ2

a=1/λ1,b=1/λ2.
Aπab=π1/λ11/λ2=πdetA .

Saya akan memberikan satu contoh terakhir di mana matriks dapat dipesan:

Dua matriks yang bisa dipesan diplot sebagai elips

Dua matriks dalam kasus ini adalah:

A=(2/31/51/53/4),B=(11/71/71)

kjetil b halvorsen
sumber
3

@ kjetil b halvorsen memberikan diskusi yang bagus tentang intuisi geometris di balik semi-definiteness positif sebagai pemesanan parsial. Saya akan memberikan pandangan yang lebih kotor dengan intuisi yang sama. Yang dihasilkan dari jenis perhitungan apa yang mungkin ingin Anda lakukan dengan matriks varians Anda.

Misalkan Anda memiliki dua variabel acak dan . Jika itu skalar, maka kita dapat menghitung variansnya sebagai skalar, dan membandingkannya dengan cara yang jelas menggunakan angka real skalar dan . Jadi jika dan , kita katakan bahwa variabel acak memiliki varians yang lebih kecil daripada .xyV(x)V(y)V(x)=5V(y)=15xy

Di sisi lain, jika dan adalah variabel acak bernilai vektor (katakanlah mereka adalah dua vektor), bagaimana kita membandingkan variansnya tidak begitu jelas. Katakan variansnya adalah: Bagaimana kita membandingkan varian dari dua vektor acak ini? Satu hal yang bisa kami lakukan hanyalah membandingkan varian elemen masing-masing. Jadi, kita dapat mengatakan bahwa varians lebih kecil dari varians dengan hanya membandingkan bilangan real, seperti: dan . Jadi, mungkin kita bisa mengatakan varianxy

V(x)=[10.50.51]V(y)=[8336]
x1y1V(x1)=1<8=V(y1)V(x2)=1<6=V(y2)x adalah varians dari jika varians dari setiap elemen adalah varians dari yang sesuai unsur . Ini akan seperti mengatakan jika masing-masing elemen diagonal adalah elemen diagonal yang sesuai dari .yxyV(x)V(y)V(x)V(y)

Definisi ini tampaknya masuk akal pada blush on pertama. Selain itu, selama matriks varians yang kami pertimbangkan adalah diagonal (yaitu semua kovarian 0), itu sama dengan menggunakan semi-definiteness. Yaitu, jika variasinya seperti lalu mengatakan positif-semi-pasti (yaitu bahwa ) sama dengan mengatakan dan . Semua tampak baik sampai kami memperkenalkan kovarian. Pertimbangkan contoh ini:

V(x)=[V(x1)00V(x2)]V(y)=[V(y1)00V(y2)]
V(y)V(x)V(x)V(y)V(x1)V(y1)V(x2)V(y2)
V(x)=[10.10.11]V(y)=[1001]
Sekarang, menggunakan perbandingan yang hanya mempertimbangkan diagonal, kita akan mengatakan , dan memang benar bahwa elemen demi elemen . Apa yang mungkin mulai mengganggu kita tentang hal ini adalah bahwa jika kita menghitung sejumlah elemen dari vektor, seperti dan , maka kita menemukan fakta bahwa meskipun kita mengatakan .V(x)V(y)V(xk)V(yk)3x1+2x23y1+2y2V(3x1+2x2)>V(3y1+2y2)V(x)V(y)

Ini aneh, bukan? Ketika dan adalah skalar, maka menjamin bahwa untuk semua , tetap yang tidak acak ,xyV(x)V(y)aV(ax)V(ay) .

Jika, untuk alasan apa pun, kita tertarik kombinasi linear dari elemen-elemen dari variabel-variabel acak seperti ini, maka kita mungkin ingin memperkuat definisi kita tentang untuk matriks varians. Mungkin kita ingin mengatakan jika dan hanya jika benar bahwa , tidak peduli apa nomor tetap dan kita pilih. Perhatikan, ini adalah definisi yang lebih kuat daripada definisi diagonal-satunya karena jika kita memilih dikatakan , dan jika kita memilih dikatakan .V(x)V(y)V(a1x1+a2x2)V(a1y1+a2y2)a1a2a1=1,a2=0V(x1)V(y1)a1=0,a2=1V(x2)V(y2)

Definisi kedua ini, yang mengatakan jika dan hanya jika untuk setiap kemungkinan vektor tetap , adalah metode umum untuk membandingkan varian matriks berdasarkan positif semi-definiteness: Lihatlah ungkapan terakhir dan definisi semi-pasti positif untuk melihat bahwa definisi untuk matriks varians dipilih tepat untuk menjamin bahwa jika dan hanya jika untuk pilihan , yaitu ketika positif setengah -pasti.V(x)V(y)V(ax)V(ay)a

V(ay)V(ax)=aV(x)aaV(y)a=a(V(x)V(y))a
V(x)V(y)V(ax)V(ay)a(V(y)V(x))

Jadi, jawaban untuk pertanyaan Anda adalah bahwa orang mengatakan varians matrix lebih kecil dari variance matrix jika positif semi-pasti karena mereka tertarik untuk membandingkan varian kombinasi linear dari elemen-elemen dari vektor acak yang mendasarinya. Definisi apa yang Anda pilih mengikuti apa yang Anda minati dalam menghitung dan bagaimana definisi itu membantu Anda dengan perhitungan tersebut.VWWV

Tagihan
sumber