Apa pentingnya matriks topi, , dalam analisis regresi?
Apakah hanya untuk perhitungan yang lebih mudah?
regression
multiple-regression
least-squares
pengguna 31466
sumber
sumber
Jawaban:
Dalam studi regresi linier, titik awal dasar adalah proses menghasilkan datay= XB + u
di mana dan deterministik. Setelah meminimalkan kriteria kuadrat terkecil, orang menemukan estimator untuk , yaitu . Setelah memasukkan estimator dalam rumus awal, seseorang mendapat sebagai model linier dari proses pembuatan data. Sekarang, seseorang dapat mengganti estimator untuk dan mendapatkanXu∼N(0,σ2I) X Bˆ B Bˆ=(X′X)−1X′y yˆ=XBˆ Bˆ yˆ=X(X′X)−1X′y.
Jadi, sebenarnya adalah matriks proyeksi. Bayangkan Anda mengambil semua variabel di . Variabelnya adalah vektor dan rentang ruang. Oleh karena itu, jika Anda mengalikan dengan , Anda memproyeksikan nilai yang diamati di ke ruang yang direntang oleh variabel dalam . Ini memberikan satu perkiraan untuk dan itulah alasan mengapa itu disebut hat matrix dan mengapa ia memiliki kepentingan yang demikian. Bagaimanapun, regresi linier tidak lebih dari sebuah proyeksi dan dengan matriks proyeksi kita tidak bisa hanya menghitung estimasi untukH=X(X′X)−1X′ X H y y X y y tetapi juga untuk dan dapat misalnya memeriksa apakah benar-benar terdistribusi normal.u
Saya menemukan gambar yang bagus di internet dan memvisualisasikan proyeksi ini. Harap dicatat, digunakan sebagai ganti . Selain itu, gambar ini menekankan vektor dari istilah kesalahan adalah ortogonal terhadap proyeksi dan karenanya tidak berkorelasi dengan perkiraan untukβ B y
sumber
Matriks topi sangat berguna karena beberapa alasan:
sumber
Ini tidak lebih dari menemukan solusi "terdekat" untuk Ax = b di mana b tidak dalam ruang kolom A. Kami memproyeksikan b ke ruang kolom, dan menyelesaikan untuk Ax (topi) = p di mana p adalah proyeksi b ke ruang kolom.
sumber