Bagaimana Anda dapat membuktikan bahwa persamaan normal: memiliki satu atau lebih solusi tanpa asumsi bahwa X tidak dapat dibalik?
Satu-satunya tebakan saya adalah bahwa itu ada hubungannya dengan invers umum, tetapi saya benar-benar tersesat.
regression
proof
ryati
sumber
sumber
Jawaban:
Seseorang tergoda untuk menjadi fasih dan menunjukkan bahwa karena bentuk kuadrat
adalah semi-pasti positif, terdapat yang minimum dan minimum ditemukan (dengan mengatur gradien terhadap β ke nol) dengan persamaan normalβ β
mana harus ada setidaknya satu solusi terlepas dari pangkatX′X . Namun, argumen ini tampaknya tidak dalam semangat pertanyaan, yang tampaknya merupakan pernyataan aljabar murni. Mungkin menarik untuk memahami mengapa persamaan seperti itu harus memiliki solusi dan dalam kondisi apa tepatnya. Jadi mari kita mulai dan berpura-pura kita tidak tahu hubungannya dengan kuadrat terkecil.
Ini semua bermuara pada makna , transpos dari X . Ini akan berubah menjadi masalah definisi sederhana, notasi yang sesuai, dan konsep bentuk sesquilinear negegenerasi. Ingatlah bahwa X adalah "matriks desain" dari n baris (satu untuk setiap pengamatan) dan kolom p (satu untuk setiap variabel, termasuk konstanta jika ada). Oleh karena itu merupakan transformasi linear dari ruang vektor V = R p ke W = R n .X′ X X n p V=Rp W=Rn
Transpos , dianggap sebagai transformasi linear , adalah transformasi linear dari ruang ganda X ′ : W ∗ → V ∗ . Dalam rangka untuk memahami komposisi seperti X ' X , maka, perlu untuk mengidentifikasi W * dengan W . Itulah apa produk dalam standar (jumlah kuadrat) pada W tidak.X X′:W∗→V∗ X′X W∗ W W
Sebenarnya ada dua produk dalam dan g W didefinisikan pada V dan W masing-masing. Ini adalah fungsi simetris bilinear bernilai nyata yang tidak merosot . Yang terakhir berarti itugV gW V W
dengan pernyataan analog untuk . Secara geometris, produk dalam ini memungkinkan kita untuk mengukur panjang dan sudut. Kondisi g ( u , v ) = 0 dapat dianggap sebagai u "tegak lurus" terhadap v . Nondegenerasi berarti bahwa hanya vektor nol yang tegak lurus terhadap seluruh ruang vektor. (Berarti umum ini bahwa hasil yang diperoleh di sini akan berlaku untuk kuadrat umum pengaturan, yang g W belum tentu biasa produk dalam yang diberikan sebagai jumlah dari produk komponen, tetapi beberapa bentuk nondegenerate sewenang-wenang. Kita bisa membuang ggV g(u,v)=0 u v gW sama sekali, mendefinisikan X ′ : W → V ∗ , tetapi saya berharap banyak pembaca menjadi tidak terbiasa atau tidak nyaman dengan spasi ganda dan karenanya memilih untuk menghindari formulasi ini.)gV X′:W→V∗
Dengan produk dalam ini di tangan, transpos setiap transformasi linear didefinisikan oleh X ′ : W → V viaX:V→W X′:W→V
untuk semua dan v ∈ V . Bahwa sebenarnya ada vektor X ′ ( w ) ∈ V dengan properti ini dapat dibuat dengan menuliskan sesuatu dengan basis untuk V dan W ; bahwa vektor ini unik mengikuti dari non-degenerasi produk dalam. Karena jika v 1 dan v 2 adalah dua vektor yang g V ( v 1 , v ) = g V ( v 2 , vw∈W v∈V X′(w)∈V V W v1 v2 untuk semua v ∈ V , kemudian (dari linieritas dalam komponen pertama) g V ( v 1 - v 2 , v ) = 0 untuk semua v yang menyiratkan v 1 - v 2 = 0 .gV(v1,v)=gV(v2,v) v∈V gV(v1−v2,v)=0 v v1−v2=0
Salah satu hasil menarik dari demonstrasi aljabar abstrak ini adalah bahwa kita dapat menyelesaikan persamaan normal dalam ruang vektor sewenang-wenang. Hasilnya berlaku, misalnya, untuk ruang kompleks, untuk ruang di atas bidang terbatas (di mana meminimalkan jumlah kuadrat tidak masuk akal), dan bahkan lebih dari ruang dimensi tak terbatas yang mendukung bentuk berurutan yang sesuai.
sumber
sumber
Dalam regresi tipikal, X adalah kurus dan oleh karena itu jelas tidak dapat dibalik (walaupun mungkin dibiarkan tidak dapat dibalik.) Sangat mudah untuk membuktikan (tanyakan apakah Anda perlu bantuan) bahwa jika X kurus dan dibiarkan tidak dapat dibalik maka X ^ T * X tidak dapat dibalik. Dalam hal ini, maka akan ada tepat satu solusi. Dan jika X tidak memiliki peringkat kolom penuh, maka X ^ T * X tidak akan menjadi peringkat penuh, dan karena itu Anda akan memiliki sistem yang tidak ditentukan.
sumber