Saya telah ke beberapa pembicaraan statistik baru-baru ini tentang Lasso (regularisasi) dan satu hal yang terus muncul adalah bahwa kita tidak benar-benar mengerti mengapa Lasso bekerja atau mengapa ia bekerja dengan sangat baik. Saya bertanya-tanya apa maksud pernyataan ini. Jelas saya mengerti mengapa Lasso bekerja secara teknis, dengan cara mencegah overfitting dengan penyusutan parameter, tetapi saya bertanya-tanya apakah ada makna yang lebih dalam di balik pernyataan seperti itu. Adakah yang punya ide? Terima kasih!
machine-learning
lasso
regularization
pengguna321627
sumber
sumber
Jawaban:
Kadang-kadang ada kurangnya komunikasi antara ahli statistik yang bekerja dan komunitas teori belajar yang mempelajari dasar-dasar metode seperti laso. Sifat teoritis laso sebenarnya sangat dipahami.
Dokumen ini memiliki ringkasan di Bagian 4 dari banyak properti yang dinikmati. Hasilnya cukup teknis, tetapi pada dasarnya:
sumber
Jika dengan memahami mengapa Lasso bekerja, maksud Anda memahami mengapa ia melakukan pemilihan fitur (yaitu, mengatur bobot beberapa fitur hingga tepat 0), kami memahami itu dengan sangat baik:
sumber
Ada masalah pemulihan tanda konsistensi pemilihan model (yang telah dijawab oleh ahli statistik ), dan
ada masalah inferensi (membangun interval kepercayaan yang baik untuk perkiraan), yang sampai menjadi topik penelitian.
Sebagian besar pekerjaan dilakukan oleh ahli statistik daripada "komunitas teori belajar".
sumber