Untuk matriks data diberikan (dengan variabel dalam kolom dan titik data dalam baris), sepertinya A T A memainkan peran penting dalam statistik. Sebagai contoh, ini adalah bagian penting dari solusi analitik kuadrat terkecil biasa. Atau, untuk PCA, vektor eigennya adalah komponen utama data.
Saya mengerti bagaimana menghitung , tapi saya bertanya-tanya apakah ada interpretasi intuitif dari apa yang diwakili matriks ini, yang mengarah ke peran penting?
Jawaban:
Secara geometris, matriks disebut matriks produk skalar (= produk titik, = produk dalam). Secara aljabar, ini disebut sum-of-squares-and-cross-products matrix ( SSCP ).A′A
Elemen diagonal ke- nya sama dengan β a 2 ( i ) , di mana a ( i ) menunjukkan nilai-nilai di kolom ke- i dari A dan β adalah jumlah seluruh baris. The i j th off-diagonal elemen di dalamnya adalah Σ a ( i ) a ( j ) .i ∑a2(i) a(i) i A ∑ ij ∑a(i)a(j)
Ada sejumlah koefisien asosiasi penting dan matriks kuadratnya disebut persamaan sudut atau persamaan tipe SSCP:
Membagi matriks SSCP dengan , ukuran sampel atau jumlah baris A , Anda mendapatkan matriks MSCP (mean-square-and-cross-product). Rumus berpasangan ukuran asosiasi ini adalah maka Σ x yn A (dengan vektorxdanymenjadi pasangan kolom dariA).∑xyn x y A
Jika Anda memusatkan kolom (variabel) dari , maka A ′ A adalah pencar (atau co-sebar, jika harus keras) matriks dan A ′ A / ( n - 1 ) adalah matriks kovarians . Rumus kovarians berpasangan adalah ∑ c x c yA A′A A′A/(n−1) dengancxdancy yangmenunjukkan kolom tengah.∑cxcyn−1 cx cy
Jika Anda z- membakukan kolom (kurangi rata-rata kolom dan dibagi dengan deviasi standar), maka A ′ A / ( n - 1 ) adalah matriks korelasi Pearson : korelasi adalah kovarians untuk variabel standar. Rumus korelasi berpasangan adalah ∑ z x z yA A′A/(n−1) denganzxdanzy yangmenunjukkan kolom standar. Korelasi ini juga disebut koefisien linearitas.∑zxzyn−1 zx zy
Jika Anda satuan skala kolom (membawa SS, jumlah-kuadrat, ke 1), maka A ′ A adalah matriks kesamaan cosinus . Rumus berpasangan yang ekuivalen dengan demikian nampaknya adalah ∑ u x u y = ∑ x yA A′A denganuxdanuy yangmenunjukkan kolom dinormalisasi L2. Kesamaan cosine juga disebut koefisien proporsionalitas.∑uxuy=∑xy∑x2√∑y2√ ux uy
Jika Anda pusat dan kemudian unit- skala kolom dari , maka A ' A adalah lagi Pearson korelasi matriks, karena korelasi adalah cosinus untuk variabel berpusat 1 , 2 : Σ c u x c u y = Σ c x c yA A′A 1,2 ∑cuxcuy=∑cxcy∑c2x√∑c2y√
Di samping keempat ukuran asosiasi utama ini, mari kita juga menyebutkan beberapa lainnya, juga berdasarkan pada , sebagai tambahan. Mereka dapat dilihat sebagai ukuran alternatif untuk cosinus kesamaan karena mereka mengadopsi berbeda dari normalisasi, penyebut dalam rumus:A′A
Koefisien identitas [Zegers & ten Berge, 1985] memiliki penyebutnya dalam bentuk rata-rata aritmatika daripada rata-rata geometris: . Itu bisa 1 jika dan hanya jika kolom yang dibandingkan dariAadalah identik.∑xy(∑x2+∑y2)/2 A
sumber
sumber
@NRH memberikan jawaban teknis yang bagus.
sumber
(B) Rentang (A) = Col (A), dengan definisi Col (A). Jadi A | Row (A) memetakan Row (A) ke dalam Col (A).
[Kebetulan memberikan bukti bahwa peringkat Row = peringkat kolom!]
sumber
sumber
sumber