Seperti yang dinyatakan dalam pertanyaan ini , peringkat maksimum matriks kovarians adalah mana adalah ukuran sampel dan jadi jika dimensi matriks kovarians sama dengan ukuran sampel, itu akan tunggal. Saya tidak mengerti mengapa kita mengurangi dari peringkat maksimum dari matriks kovarians.n 1 n
covariance-matrix
linear-algebra
pengguna3070752
sumber
sumber
Jawaban:
Estimator yang tidak bias dari matriks kovarian sampel yang diberikann titik data xi∈Rd adalah mana ˉ x =∑xi/nadalah rata-rata di semua titik. Marilah kita menyatakan(xi- ˉ x )sebagaizi. The1
Mengapa memiliki peringkat n - 1 dan bukan peringkat n , seperti yang terlihat karena kita menjumlahkan matriks n peringkat- 1 ?∑ziz⊤i n−1 n n 1
Jawabannya adalah itu terjadi karena tidak independen. Dengan konstruksi, ∑ z i = 0 . Jadi, jika Anda tahu n - 1 dari z i , maka z n yang tersisa sepenuhnya ditentukan; kita tidak menjumlahkan n independen Rank 1 matriks, kita menjumlahkan hanya n - 1 independen Rank 1 matriks dan kemudian menambahkan satu lagi Rank 1 matriks yang sepenuhnya linear ditentukan oleh sisanya. Penambahan terakhir ini tidak mengubah peringkat keseluruhan.zi ∑zi=0 n−1 zi zn n 1 n−1 1 1
Kita bisa melihat ini secara langsung jika kita menulis ulang sebagai z n = - n - 1 Σ i = 1 z i , dan sekarang hubungkan ke ekspresi di atas: n Σ i = 1 z i z ⊤ i = n - 1 ∑ i = 1 z i z ⊤ i + ( - n - 1 ∑ i = 1∑zi=0
Hasil ini, omong-omong, mengisyaratkan mengapa faktor dalam penaksir kovarians yang tidak memihak adalah dan bukan11n−1 .1n
Intuisi geometris yang saya singgung dalam komentar di atas adalah bahwa seseorang dapat selalu cocok dengan garis 1D untuk dua titik dalam 2D dan satu selalu dapat memasukkan bidang 2D ke tiga titik dalam 3D, yaitu dimensi subruang selalu ; ini hanya berfungsi karena kami menganggap bahwa garis ini (dan bidang) dapat "bergerak" agar sesuai dengan poin kami. "Memposisikan" garis ini (atau bidang) sedemikian sehingga melewati ˉ x setara dengan berpusat pada argumen aljabar di atas.n−1 x¯
sumber
Agak pendek, saya yakin, penjelasannya seperti ini:
Mari kita mendefinisikan matriksn x m matriks x titik sampel data di mana
n adalah sejumlah variabel dan m adalah sejumlah sampel untuk setiap variabel. Mari kita asumsikan bahwa tidak ada variabel yang bergantung secara linear.
Pangkatx adalah min(n,m) .
Mari kita mendefinisikan matriksn x m matriks z dari variabel berpusat searah baris:
sumber