Saya baru mengonversi rumus ke bentuk matriks. Tetapi ini diperlukan untuk kode pembelajaran mesin yang efisien. Jadi saya ingin mengerti cara "benar", bukan hal koboi yang saya lakukan.
Baiklah kita mulai, saya mencoba untuk mengubah jumlah kuadrat tertimbang dari bentuk di bawah ini ke dalam bentuk matriks. Saya sering melihat bentuk matriks sebagai setara dengan yang di bawah ini, dan tidak ada penjelasan tentang bagaimana itu diturunkan.
di mana adalah bobot untuk setiap kesalahan sampel . Juga, , , , , . adalah nilai prediksi, hasil dari mengalikan vektor bobot dengan vektor fitur.
Inilah yang saya pikirkan, dan saya menjadi kreatif. Jadi jangan ragu untuk melewatkan sampai akhir jika saya bersinggungan.
Biarkan menjadi vektor kolom fungsi yang mewakili kesalahan non-kuadrat. Kami dapat mewakili lebih dari sebagai
Hasil vektor dikalikan dengan vektor adalah matriks (skalar).
Biarkan menjadi vektor bobot yang menimbang setiap kesalahan sampel. Karena kita perlu menimbang kesalahan kuadrat, kita perlu memasukkan dalam Formula sebelum mendapatkan skalar. Karena kita ingin pertama tetap sebagai vektor , kita mendefinisikan sebagai matriks diagonal dengan istilah diagonal yang berasal dari . Kami sekarang memiliki:
Kita dapat menyederhanakan ini menjadi
Sekarang kita memperluas . Kami memiliki dikalikan dengan , memberi kami mana X sekarang merupakan matriks dan adalah vektor kolom. Biarkan y menjadi vektor vektor kolom mewakili label . Sekarang . Kami mengganti ini menjadi Formula , memberi kami jumlah kuadrat tertimbang terakhir dalam bentuk matriks:
Pertama, apakah ini masuk akal? Kedua, dan yang paling penting, apakah ini sebenarnya yang seharusnya Anda lakukan?
Terima kasih
Jawaban:
Saya akan berani menjawab pertanyaan ini: Segala sesuatu yang Anda sajikan benar.
Apa yang pada dasarnya Anda peroleh adalah teorema Gauss-Markov: penaksir kuadrat terkecil tertimbang adalah penaksir tidak bias linier terbaik untuk data tertimbang. Estimator ini meminimalkan jumlah kuadrat-tertimbang (tampilan pertama Anda) dan diberikan oleh: . Berikut adalah matriks desain dengan kolom set pertama untuk yang vektor yang (ini adalah istilah intercept).β^WL S= (XTW X ) (XTW Y) X 1 n × 1
Hasil ini berlaku untuk matriks kovarians yang sewenang-wenang. Namun, data independen tertimbang diwakili dengan vektor bobot sepanjang diagonal dari matriks berat. (notasi Anda memiliki sebagai koefisien regresi dan sebagai bobot, jadi untuk menghindari kebingungan, matriks desain adalah dan .w kamu X =[x], W =diag(u), β= [ w ]
The bukti dari teorema Gauss Markov adalah dengan kontradiksi. Lihat di sini . Maksudnya adalah bahwa kita tidak secara analitik memperoleh estimator seperti itu langsung dari fungsi kerugian. Anda mungkin telah melihat pendekatan seperti itu yang digunakan untuk mendapatkan persamaan estimasi regresi linier dan logistik.
sumber