Dalam buku "Elemen-elemen Pembelajaran Statistik" pada bab 2 ("model linear dan kuadrat terkecil; halaman no: 12"), tertulis bahwa
Dalam (p + 1) ruang input-output dimensi, (X, Y) mewakili hyperplane. Jika konstanta termasuk dalam X, maka hyperplane menyertakan asal dan merupakan subruang; jika tidak, itu adalah set affine yang memotong sumbu Y pada titik (0, ).
Saya tidak mendapatkan kalimat "jika konstanta adalah ... (0, )". Tolong bantu? Saya pikir hyperplane akan memotong sumbu Y di (0, ) dalam kedua kasus, apakah itu benar?
Jawaban di bawah agak membantu, tetapi saya mencari jawaban yang lebih spesifik. Saya mengerti bahwa ketika dimasukkan dalam , itu tidak akan berisi asal, tapi kemudian bagaimana akan mengandung asal? Tidakkah seharusnya itu tergantung pada nilai ? Jika intersep bukan , tidak boleh berisi asal, dalam pemahaman saya?
sumber
Jawaban:
Memasukkan konstantaβX β0+βX
1
dalam vektor input adalah trik umum untuk memasukkan bias (pikirkan tentang penyadapan-Y) tetapi menjaga semua istilah ekspresi simetris: Anda dapat menulis alih-alih mana-mana.Jika Anda melakukan ini, maka benar bahwa hyperplane menyertakan asal, karena asal adalah vektor dari nilai dan mengalikannya untuk memberikan nilai .Y=βX 0 β 0
Namun, vektor input Anda akan selalu memiliki elemen pertama sama dengan ; karena itu mereka tidak akan pernah berisi asal-usulnya, dan akan ditempatkan pada hyperplane yang lebih kecil, yang memiliki satu dimensi lebih sedikit.1
Anda dapat memvisualisasikan ini dengan memikirkan garis pada lembar kertas Anda (2 dimensi). Hyperplane yang sesuai jika Anda memasukkan bias vektor Anda menjadi dan koefisien Anda . Dalam 3 dimensi ini adalah bidang yang lewat dari titik asal, yang memotong bidang menghasilkan garis tempat input Anda dapat ditempatkan.Y=mx+q q X=[x,x0=1] β=[m,q] x0=1
sumber
Untuk membantu Anda memahami ini, saya membuat visualisasi kasus yang sangat sederhana.
Katakanlah kita memiliki masalah satu dimensi (p = 1) sehingga satu fitur (variabel input)X1 untuk memprediksi satu variabel keluaran Y . Mari kita bayangkan bahwa kita sudah menemukan penyadapanβ0=5 dan koefisien β1=2 untuk variabel input kami X1 .
Model linier kami akan terlihat seperti:Y^=β0+β1×X1 .
Oleh karena itu representasi yang jelas akan menjadi hyperplane (garis) di (p + 1) -dimensi ruang dalam kasus ini (2d):
Representasi lain adalah menambahkan variabel lainX0 yang akan mengarah pada persamaan berikut: Y^=β0×X0+β1×X1 .
Dalam praktiknya kita tahu ituX0 akan menjadi konstan dan sama dengan 1 tetapi mari kita asumsikan itu belum diperbaiki. Dalam hal ini, kita sekarang dapat memplot grafik 3d dengan hyperplane sebagai berikut:
Akhirnya karena kita hanya tahuX0=1 mungkin saya disorot dengan garis putus-putus merah satu-satunya proyeksi bekerja dari hyperplane ini yang sesuai persis dengan plot yang kami miliki sebelumnya.
sumber