Intuisi di belakang

10

Bentuk tertutup w dalam regresi Linear dapat ditulis sebagai

w^=(XTX)1XTy

Bagaimana kita bisa secara intuitif menjelaskan peran dalam persamaan ini?(XTX)1

Darshak
sumber
2
Bisakah Anda menguraikan apa yang Anda maksud dengan "secara intuitif"? Misalnya, ada penjelasan yang sangat intuitif tentang ruang-ruang produk dalam yang disajikan dalam Jawaban Plane untuk Pertanyaan Kompleks Christensen , tetapi tidak semua orang akan menghargai pendekatan itu. Sebagai contoh lain, ada penjelasan geometris dalam jawaban saya di stats.stackexchange.com/a/62147/919 , tetapi tidak semua orang memandang hubungan geometris sebagai "intuitif."
whuber
Secara intuitif seperti apa arti $ (X ^ TX) ^ {- 1}? Apakah ini semacam perhitungan jarak atau sesuatu, saya tidak memahaminya.
Darshak
1
Itu sepenuhnya dijelaskan dalam jawaban yang saya tautkan.
whuber
Pertanyaan ini sudah ada di sini meskipun mungkin tidak dengan jawaban yang memuaskan math.stackexchange.com/questions/2624986/…
Sextus Empiricus

Jawaban:

5

Saya menemukan posting ini sangat membantu:

Bagaimana cara mendapatkan estimator kuadrat terkecil untuk regresi linier berganda?

Hubungan antara SVD dan PCA. Bagaimana cara menggunakan SVD untuk melakukan PCA?

http://www.math.miami.edu/~armstrong/210sp13/HW7notes.pdf

Jika adalah n × p matriks maka matriks X ( X T X ) - 1 X T mendefinisikan proyeksi ke ruang kolom dari X . Secara intuitif, Anda memiliki sistem overdetermined persamaan, namun tetap ingin menggunakannya untuk menentukan peta linear R pR yang akan memetakan baris x i dari X untuk sesuatu yang dekat dengan nilai-nilai y i , i { 1 , ... , n }Xn×pX(XTX)1XTXRpRxiXyii{1,,n}. Jadi kami setuju untuk mengirim ke hal terdekat ke y yang dapat dinyatakan sebagai kombinasi linear dari fitur Anda (kolom X ). XyX

Sejauh interpretasi , saya tidak punya jawaban yang menakjubkan belum. Saya tahu Anda dapat menganggap ( X T X ) sebagai dasarnya adalah matriks kovarian dari dataset.(XTX)1(XTX)

James McKeown
sumber
kadang-kadang disebut sebagai "sebar matriks" dan hanya versi yang ditingkatkan dari matriks kovarians(XTX)
JacKeown
4

Sudut pandang geometris

Sebuah sudut pandang geometris dapat menjadi seperti n-dimensi vektor dan X β menjadi poin dalam n-dimensi-ruang V . Dimana X β juga dalam subruang W direntang oleh vektor-vektor x 1 , x 2 , , x m .yXβVXβ^Wx1,x2,,xm

proyeksi

Dua jenis koordinat

Untuk subruang kita dapat membayangkan dua jenis koordinat yang berbeda :W

  • The β seperti koordinat untuk ruang biasa koordinat. Vektor dalam ruang W adalah kombinasi linear dari vektor x i z = β 1 x 1 + β 2 x 1 + . . .zWxi
    z=β1x1+β2x1+....βmxm
  • The α tidak koordinat dalam arti biasa, tetapi mereka menentukan titik di ruang bagian . Setiap α i berhubungan dengan proyeksi tegak lurus ke vektor x i . Jika kita menggunakan vektor satuan x i (untuk kesederhanaan) maka "koordinat" α i untuk vektor z dapat dinyatakan sebagai:Wαixixiαiz

    αi=xiTz

    dan himpunan semua koordinat sebagai:

α=XTz

Pemetaan antara koordinat dan βαβ

untuk ekspresi "koordinat" αz=Xβα menjadi konversi dari koordinat ke "koordinat" αβα

α=XTXβ

Anda bisa melihat sebagai menyatakan berapa banyak masing-masing x i(XTX)ijxi diproyeksikan ke yang lain xj

Kemudian interpretasi geometris dapat dilihat sebagai peta dari proyeksi vektor "koordinat" α ke koordinat linear β .(XTX)1αβ

β=(XTX)1α

Ekspresi memberikan proyeksi "koordinat" dari y dan ( X T X ) - 1 bergantian mereka ke β .XTyy(XTX)1β


Catatan : proyeksi "koordinat" dari adalah sama seperti proyeksi "koordinat" dari y sejak ( y - y ) X .y y^(yy^)X

Sextus Empiricus
sumber
Akun yang sangat mirip dengan stat topik.stackexchange.com/a/124892/3277 .
ttnphns
Memang sangat mirip. Bagi saya pandangan ini sangat baru dan saya harus menghabiskan malam untuk memikirkannya. Saya memang selalu melihat regresi kuadrat paling sedikit dalam hal proyeksi tetapi dalam sudut pandang ini saya tidak pernah mencoba untuk merealisasikan makna intuitif pada bagian atau saya selalu melihatnya dalam ekspresi yang lebih tidak langsung X T y = X T X β . (XTX)1XTy=XTXβ
Sextus Empiricus
3

yi=α+βxi+εi
β=cov[xi,yi]var[xi]

XyXXXXXy(XX)1Xy

Aksakal
sumber
Tetapi analogi itu sendiri tidak memberi tahu Anda apakah sebelum atau sesudah masa kadaluwarsa dengan kebalikannya.
kjetil b halvorsen
@kjetilbhalvorsen, saya menempatkan urutan operasi
Aksakal