Katakanlah saya memiliki distribusi Gaussian multivariat dimensional. Dan saya mengambil pengamatan (masing-masing satu -vector) dari distribusi ini dan menghitung sampel kovarians matriks . Dalam hal ini kertas , negara penulis bahwa matriks kovarians sampel dihitung dengan adalah tunggal.
- Bagaimana itu benar atau diturunkan?
- Ada penjelasan?
covariance-matrix
linear-algebra
pengguna34790
sumber
sumber
Jawaban:
Beberapa fakta tentang peringkat matriks, ditawarkan tanpa bukti (tetapi bukti dari semua atau hampir semuanya harus diberikan dalam teks aljabar linier standar, atau dalam beberapa kasus ditetapkan sebagai latihan setelah memberikan informasi yang cukup untuk dapat melakukannya):
Jika dan adalah dua matriks yang sesuai, maka:SEBUAH B
(i) peringkat kolom = peringkat barisSEBUAH SEBUAH
(ii)rank ( A ) = rank ( AT) = peringkat ( ATA ) = peringkat ( A AT)
(iii)peringkat ( A B ) ≤ min ( peringkat ( A ) , peringkat ( B ) )
(iv)peringkat ( A + B ) ≤ peringkat ( A ) + peringkat ( B )
(v) jikaB adalah matriks kuadrat dari peringkat penuh, maka peringkat ( A B ) = peringkat ( A )
Pertimbangkann × p matriks data sampel, y . Dari yang di atas, pangkat y paling banyak min ( n , p ) .
Lebih jauh, dari yang di atas jelas peringkat tidak akan lebih besar dari peringkat (dengan mempertimbangkan perhitungan dalam bentuk matriks, dengan mungkin beberapa penyederhanaan).y SS y S
Jika maka dalam hal ini .peringkat ( y ) < p peringkat ( S ) < pn < p peringkat ( y) < hal peringkat ( S) < hal
sumber
Jawaban singkat untuk pertanyaan Anda adalah peringkat . Jadi jika , maka adalah singular.p > n S( S) ≤ n - 1 p > n S
Untuk jawaban yang lebih terperinci, ingat bahwa matriks kovarians sampel (tidak bias) dapat ditulis sebagai
Secara efektif, kami menjumlahkan matriks, masing-masing memiliki pangkat 1. Dengan asumsi pengamatan independen secara linear, dalam beberapa hal setiap pengamatan berkontribusi 1 ke peringkat , dan 1 dikurangkan dari peringkat (jika ) karena kami memusatkan setiap pengamatan dengan . Namun, jika multikolinearitas hadir dalam pengamatan, maka peringkat dapat dikurangi, yang menjelaskan mengapa peringkat tersebut mungkin kurang dari .x i ( S ) p > n ˉ x ( S ) n - 1n xsaya (S) p > n x¯ (S) n - 1
Sejumlah besar pekerjaan telah dilakukan untuk mempelajari masalah ini. Sebagai contoh, seorang kolega saya dan saya menulis makalah tentang topik yang sama, di mana kami tertarik untuk menentukan bagaimana melanjutkan jika adalah tunggal ketika diterapkan pada analisis diskriminan linier dalam pengaturan .p ≫ nS p ≫ n
sumber
Ketika Anda melihat situasi dengan cara yang benar, kesimpulan secara intuitif jelas dan langsung.
Posting ini menawarkan dua demonstrasi. Yang pertama, tepat di bawah, adalah dalam kata-kata. Ini setara dengan gambar sederhana, muncul di bagian paling akhir. Di antaranya adalah penjelasan tentang apa arti kata-kata dan gambar.
Kovarians matriks untuk p pengamatan -variate adalah p × p matriks dihitung dengan kiri mengalikan matriks X n p (data recentered) oleh transposnya X ' p n . Produk matriks ini mengirimkan vektor melalui pipa ruang vektor di mana dimensi p dan n . Akibatnya matriks kovarians, qua transformasi linear, akan mengirim R n ke dalam ruang bagian yang dimensi adalah paling min ( p , n ) .n hal p × p Xn p X′p n hal n Rn min(p,n) Langsung bahwa pangkat matriks kovarians tidak lebih besar dari . min(p,n) Akibatnya, jika maka pangkatnya paling banyak n , yang - karena lebih kecil dari berarti matriks kovarians adalah singular.p>n n p
Semua terminologi ini sepenuhnya dijelaskan dalam sisa posting ini.
(Seperti yang Amoeba tunjukkan dengan ramah pada komentar yang sekarang dihapus, dan ditunjukkan dalam jawaban untuk pertanyaan terkait , gambar sebenarnya terletak pada codimension-one subruang dari (terdiri dari vektor yang komponen dijumlahkan ke nol) karena semua kolomnya telah dipusatkan kembali pada nol. Oleh karena itu pangkat matriks kovarian sampel tidak dapat melebihi )R n 1X Rn n-11n−1X′X n−1
Aljabar linier adalah semua tentang pelacakan dimensi ruang vektor. Anda hanya perlu menghargai beberapa konsep dasar untuk memiliki intuisi mendalam untuk pernyataan tentang pangkat dan singularitas:
Perkalian matriks merupakan transformasi linear dari vektor. Sebuah matriks merupakan transformasi linear dari berdimensi ruang ke berdimensi ruang . Secara khusus, ia mengirimkan ke . Bahwa ini adalah transformasi linear segera mengikuti dari definisi transformasi linear dan sifat-sifat dasar aritmatika perkalian matriks.M n V n m V m x ∈ V n M x = y ∈ V mm×n M n Vn m Vm x∈Vn Mx=y∈Vm
Transformasi linier tidak pernah dapat meningkatkan dimensi. Ini berarti bahwa citra seluruh ruang vektor di bawah transformasi M (yang merupakan ruang sub-vektor dari V m ) dapat memiliki dimensi tidak lebih besar dari n . Ini adalah teorema (mudah) yang mengikuti dari definisi dimensi.Vn M Vm n
Dimensi ruang sub-vektor tidak dapat melebihi ruang di mana ia berada. Ini adalah teorema, tetapi sekali lagi jelas dan mudah dibuktikan.
The rank dari transformasi linear adalah dimensi citra. Pangkat matriks adalah pangkat transformasi linear yang diwakilinya. Ini adalah definisi.
Sebuah singular matriks memiliki peringkat ketat kurang dari nMmn n (dimensi domainnya). Dengan kata lain, citranya memiliki dimensi yang lebih kecil. Ini adalah definisi.
Untuk mengembangkan intuisi, ada baiknya melihat dimensi. Oleh karena itu saya akan menulis dimensi semua vektor dan matriks segera setelah mereka, seperti dalam dan x n . Demikianlah rumus generiknyaMmn xn
dimaksudkan untuk berarti bahwa matriks M , bila diterapkan pada n -vector x , menghasilkan m -vector y .m×n M n x m y
Produk dari matriks dapat dianggap sebagai "pipa" dari transformasi linear. Umum, misalkan merupakan sebuah vektor berdimensi yang dihasilkan dari aplikasi berturut-turut dari linear transformasi M m n , L l m , ... , B b c , dan A sebuah b ke n -vector x n yang datang dari ruang V n . Ini mengambil vektor x n secara berurutan melalui seperangkat ruang vektor dimensi mya a Mmn,Llm,…,Bbc, SEBUAHa b n xn Vn xn dan akhirnya a .m , l , ... , c , b , Sebuah
Cari bottleneck : karena dimensi tidak dapat meningkat (titik 2) dan subruang tidak dapat memiliki dimensi lebih besar dari ruang di mana mereka berada (titik 3), maka dimensi gambar tidak dapat melebihi dimensi terkecil min ( a , b , c , ... , l , m , n ) ditemui di dalam pipa.Vn min ( a , b , c , ... , l , m , n )
Diagram pipa ini, kemudian, sepenuhnya membuktikan hasilnya ketika diterapkan pada produk :X′X
sumber