Pertimbangkan regresi linier dengan beberapa regularisasi: Misalnya Find yang meminimalkan | | A x - b | | 2 + λ | | x | | 1
Biasanya, kolom A distandarisasi untuk memiliki rata-rata nol dan norma satuan, sedangkan berpusat untuk memiliki rata-rata nol. Saya ingin memastikan apakah pemahaman saya tentang alasan standardisasi dan pemusatan adalah benar.
Dengan membuat sarana kolom dan b nol, kita tidak perlu istilah intersepsi lagi. Kalau tidak, tujuannya adalah | | A x - x 0 1 - b | | 2 + λ | | x | | 1 . Dengan membuat norma-norma kolom A sama dengan 1, kami menghapus kemungkinan kasus di mana hanya karena satu kolom A memiliki norma yang sangat tinggi, itu mendapatkan koefisien rendah dalam x , yang mungkin membuat kita menyimpulkan secara tidak benar bahwa kolom A tidak "menjelaskan" x dengan baik.
Alasan ini tidak tepat tetapi secara intuitif, apakah itu cara berpikir yang benar?
$x$ does not ''explain'' $A$ well
x does not ''explain'' $A$ at all