Jika regresi polinomial memodelkan hubungan nonlinear, bagaimana hal itu dapat dianggap sebagai kasus khusus dari regresi linier berganda?
Wikipedia mencatat bahwa "Meskipun regresi polinomial cocok dengan model nonlinier untuk data, sebagai masalah estimasi statistik linear, dalam arti bahwa fungsi regresi adalah linear dalam parameter yang tidak diketahui yang diperkirakan dari data. "
Bagaimana regresi linier polinomial dalam parameter yang tidak diketahui jika parameter adalah koefisien untuk syarat dengan pesanan 2?
Jawaban:
Ketika Anda memasukkan model regresi seperti , model dan penaksir OLS tidak 'tahu' bahwa hanyalah kuadrat dari , itu hanya 'berpikir' itu variabel lain. Tentu saja ada beberapa collinearity, dan yang dimasukkan ke dalam fit (misalnya, kesalahan standar lebih besar daripada yang seharusnya), tetapi banyak pasangan variabel bisa agak collinear tanpa salah satu dari mereka menjadi fungsi dari yang lain. x 2 i xiy^i=β^0+β^1xi+β^2x2i x2i xi
Kami tidak menyadari bahwa sebenarnya ada dua variabel terpisah dalam model, karena kami tahu bahwa pada akhirnya adalah variabel yang sama dengan yang kami transformasikan dan sertakan untuk menangkap hubungan lengkung antara dan . Pengetahuan tentang sifat sebenarnya dari , ditambah dengan keyakinan kami bahwa ada hubungan lengkung antara dan adalah apa yang membuatnya sulit bagi kita untuk memahami cara itu masih linier dari perspektif model. Selain itu, kami memvisualisasikan dan x i x i y i x 2 i x i y i x i x 2 i x , yx2i xi xi yi x2i xi yi xi x2i bersama-sama dengan melihat proyeksi marginal dari fungsi 3D ke bidang 2D . x,y
Jika Anda hanya memiliki dan , Anda dapat mencoba memvisualisasikannya dalam ruang 3D penuh (walaupun masih agak sulit untuk benar-benar melihat apa yang sedang terjadi). Jika Anda melihat fungsi pas di ruang 3D penuh, Anda akan melihat bahwa fungsi pas adalah bidang 2D, dan terlebih lagi itu adalah bidang datar. Seperti yang saya katakan, sulit untuk melihat dengan baik karena data hanya ada sepanjang garis lengkung melalui ruang 3D (fakta itu adalah manifestasi visual dari collinearity mereka). Kita dapat mencoba melakukannya di sini. Bayangkan ini adalah model yang pas: x 2 i x i , x 2 ixi x2i xi,x2i
Mungkin lebih mudah untuk melihat dalam gambar-gambar ini, yang merupakan screenshot dari gambar 3D yang dirotasi yang dibuat dengan data yang sama menggunakan
rgl
paket.Ketika kita mengatakan bahwa model yang "linier dalam parameter" benar-benar linier, ini bukan hanya beberapa kecanggihan matematika. Dengan variabel , Anda memasang hipplane dimensi- dalam hiperspace dimensi (dalam contoh kami bidang 2D dalam ruang 3D). Hyperplane itu benar-benar 'datar' / 'linier'; itu bukan hanya metafora. p pp p p+1
sumber
Jadi model linear umum adalah fungsi yang linier dalam parameter yang tidak diketahui . Regresi polinomial, misalnya adalah kuadratik sebagai fungsi tetapi linier dalam koefisien , dan . Lebih umum, model linier umum dapat dinyatakan sebagai , di mana adalah fungsi sewenang-wenang dari input vektor - melihat bahwa dapat menyertakan istilah interaksi apa pun (antara komponen ) dan sejenisnya.y=a+bx+cx2 x a b c y=∑Ni=0aihi(x) hi x hi x
sumber
Pertimbangkan model
Ini dapat ditulis ulang
sumber