Pertanyaan tentang bukti persamaan normal

11

Bagaimana Anda dapat membuktikan bahwa persamaan normal: memiliki satu atau lebih solusi tanpa asumsi bahwa X tidak dapat dibalik?(XTX)β=XTY

Satu-satunya tebakan saya adalah bahwa itu ada hubungannya dengan invers umum, tetapi saya benar-benar tersesat.

ryati
sumber
1
Anda mendapatkan poin dengan mengajukan pertanyaan yang memancing jawaban luar biasa.
Nikana Reklawyks

Jawaban:

14

Seseorang tergoda untuk menjadi fasih dan menunjukkan bahwa karena bentuk kuadrat

β(YXβ)(YXβ)

adalah semi-pasti positif, terdapat yang minimum dan minimum ditemukan (dengan mengatur gradien terhadap β ke nol) dengan persamaan normalββ

XX(YXβ)=0,

mana harus ada setidaknya satu solusi terlepas dari pangkat XX . Namun, argumen ini tampaknya tidak dalam semangat pertanyaan, yang tampaknya merupakan pernyataan aljabar murni. Mungkin menarik untuk memahami mengapa persamaan seperti itu harus memiliki solusi dan dalam kondisi apa tepatnya. Jadi mari kita mulai dan berpura-pura kita tidak tahu hubungannya dengan kuadrat terkecil.


Ini semua bermuara pada makna , transpos dari X . Ini akan berubah menjadi masalah definisi sederhana, notasi yang sesuai, dan konsep bentuk sesquilinear negegenerasi. Ingatlah bahwa X adalah "matriks desain" dari n baris (satu untuk setiap pengamatan) dan kolom p (satu untuk setiap variabel, termasuk konstanta jika ada). Oleh karena itu merupakan transformasi linear dari ruang vektor V = R p ke W = R n .XXXnpV=RpW=Rn

Transpos , dianggap sebagai transformasi linear , adalah transformasi linear dari ruang ganda X : WV . Dalam rangka untuk memahami komposisi seperti X ' X , maka, perlu untuk mengidentifikasi W * dengan W . Itulah apa produk dalam standar (jumlah kuadrat) pada W tidak.X X:WVXXWWW

Sebenarnya ada dua produk dalam dan g W didefinisikan pada V dan W masing-masing. Ini adalah fungsi simetris bilinear bernilai nyata yang tidak merosot . Yang terakhir berarti itugVgWVW

gW(u,v)=0 uWv=0,

dengan pernyataan analog untuk . Secara geometris, produk dalam ini memungkinkan kita untuk mengukur panjang dan sudut. Kondisi g ( u , v ) = 0 dapat dianggap sebagai u "tegak lurus" terhadap v . Nondegenerasi berarti bahwa hanya vektor nol yang tegak lurus terhadap seluruh ruang vektor. (Berarti umum ini bahwa hasil yang diperoleh di sini akan berlaku untuk kuadrat umum pengaturan, yang g W belum tentu biasa produk dalam yang diberikan sebagai jumlah dari produk komponen, tetapi beberapa bentuk nondegenerate sewenang-wenang. Kita bisa membuang ggVg(u,v)=0uvgW sama sekali, mendefinisikan X : WV , tetapi saya berharap banyak pembaca menjadi tidak terbiasa atau tidak nyaman dengan spasi ganda dan karenanya memilih untuk menghindari formulasi ini.)gVX:WV

Dengan produk dalam ini di tangan, transpos setiap transformasi linear didefinisikan oleh X : WV viaX:VWX:WV

gV(X(w),v)=gW(w,X(v))

untuk semua dan v V . Bahwa sebenarnya ada vektor X ( w ) V dengan properti ini dapat dibuat dengan menuliskan sesuatu dengan basis untuk V dan W ; bahwa vektor ini unik mengikuti dari non-degenerasi produk dalam. Karena jika v 1 dan v 2 adalah dua vektor yang g V ( v 1 , v ) = g V ( v 2 , vwWvVX(w)VVWv1v2 untuk semua v V , kemudian (dari linieritas dalam komponen pertama) g V ( v 1 - v 2 , v ) = 0 untuk semua v yang menyiratkan v 1 - v 2 = 0 .gV(v1,v)=gV(v2,v)vVgV(v1v2,v)=0vv1v2=0

UW,UUX(V)X{X(v)|vV}WXX

X(w)=0wX(V).

wXwX

  1. X(w)=0gW(w,X(v))=gV(X(w),v)=gV(0,v)=0vVwX(V)

  2. wX(V)gW(w,X(v))=0vVgV(X(w),v)=0gVX(w)=0

WW=X(V)X(V) yWy=y0+yy0X(V)yX(V)y0X(β)βV

yXβ=(y0+y)y0=yX(V)

X

X(yXβ)=0,

βXXβ=Xy.


nyWy0Xyy0y0pβVX(V)XXVW

VU=X(V)WXU


Salah satu hasil menarik dari demonstrasi aljabar abstrak ini adalah bahwa kita dapat menyelesaikan persamaan normal dalam ruang vektor sewenang-wenang. Hasilnya berlaku, misalnya, untuk ruang kompleks, untuk ruang di atas bidang terbatas (di mana meminimalkan jumlah kuadrat tidak masuk akal), dan bahkan lebih dari ruang dimensi tak terbatas yang mendukung bentuk berurutan yang sesuai.

whuber
sumber
1
Saya tidak pernah memiliki perwakilan untuk menerima jawaban ini sampai nanti. Saya baru saja tersandung pada ini dan ingin mengucapkan terima kasih lagi!
ryati
β(YXβ)(YXβ)
β(YXβ)(YXβ),
f:AB.
Michael Hardy
@Michael Pasti ada kesalahan ketik pada komentar Anda. Maukah Anda mengklarifikasi maksud Anda?
whuber
''''
Michael Hardy
@Michael Maafkan aku karena tidak melihat perbedaan itu, meskipun banyak bacaan. Apapun, bagi saya panah pertama mengacu pada fungsi injeksi sedangkan yang kedua mengacu pada fungsi apa pun, tapi saya curiga bukan itu yang Anda maksudkan. Maukah Anda menjelaskan notasi Anda?
whuber
0

nXTXxxi=xyy¯

Lucozade
sumber
X=[1 x1;1 x2;;1 xn]X=[1 x11xm1;;1 x1nxmn]
3
XX
0

Dalam regresi tipikal, X adalah kurus dan oleh karena itu jelas tidak dapat dibalik (walaupun mungkin dibiarkan tidak dapat dibalik.) Sangat mudah untuk membuktikan (tanyakan apakah Anda perlu bantuan) bahwa jika X kurus dan dibiarkan tidak dapat dibalik maka X ^ T * X tidak dapat dibalik. Dalam hal ini, maka akan ada tepat satu solusi. Dan jika X tidak memiliki peringkat kolom penuh, maka X ^ T * X tidak akan menjadi peringkat penuh, dan karena itu Anda akan memiliki sistem yang tidak ditentukan.

pengguna542833
sumber
1
XXX0β=0 β
whuber: tentu saja mereka menjawab pertanyaan: satu soln jika X adalah peringkat kolom penuh (seperti yang saya sebutkan), dan solusi tanpa batas jika itu adalah sistem yang tidak ditentukan
user542833
1
Fakta bahwa sistem ini "tidak ditentukan" tidak berarti ia memiliki solusi sama sekali. Pertanyaannya adalah tentang adanya solusi.
whuber