Saya mengerti apa peran lambda dalam regresi elastis-bersih. Dan saya bisa mengerti mengapa orang akan memilih lambda.min, nilai lambda yang meminimalkan kesalahan divalidasi silang.
Pertanyaan saya adalah Di mana dalam literatur statistik direkomendasikan untuk menggunakan lambda.1se, yaitu nilai lambda yang meminimalkan kesalahan CV ditambah satu kesalahan standar ? Sepertinya saya tidak dapat menemukan kutipan resmi, atau bahkan alasan mengapa ini sering merupakan nilai yang baik. Saya mengerti bahwa ini adalah regularisasi yang lebih ketat, dan akan mengecilkan parameter lebih ke nol, tapi saya tidak selalu yakin dengan kondisi di mana lambda.1se adalah pilihan yang lebih baik daripada lambda.min. Bisakah seseorang membantu menjelaskan?
Jawaban:
Friedman, Hastie, dan Tibshirani (2010) , mengutip The Elements of Statistics Learning , menulis,
Alasan untuk menggunakan satu kesalahan standar, berbeda dengan jumlah lainnya, tampaknya karena itu, yah ... standar. Krstajic, et al (2014) menulis (tambang penekanan tebal):
sumber
Buku Breiman et al. (Dikutip dalam kutipan jawaban lain dari Krstajic) adalah referensi tertua yang saya temukan untuk aturan 1SE.
Ini adalah Breiman, Friedman, Stone, dan Pohon Klasifikasi dan Regresi Olshen (1984). Mereka "menurunkan" aturan ini di bagian 3.4.3.
Jadi, jika Anda memerlukan kutipan resmi, itu sepertinya sumber aslinya.
sumber