Mengapa “lasso santai” berbeda dari laso standar?

Jika kita mulai dengan satu set data , menerapkan Lasso untuk itu dan mendapatkan solusi , kita dapat menerapkan Lasso lagi ke set data , di mana adalah himpunan bukan-nol indeks , untuk mendapatkan solusi, , disebut solusi 'santai LASSO' (koreksi saya jika saya salah!). Solusi harus memenuhi kondisi Karush – Kuhn – Tucker (KKT) untuk $(X,Y)$ $\beta^L$ $(X_S, Y)$ $S$ $\beta^L$ $\beta^{RL}$ $\beta^L$ $(X,Y)$ tetapi, mengingat bentuk kondisi KKT untuk , bukankah ini juga memuaskan? Jika demikian, apa gunanya melakukan LASSO untuk kedua kalinya? $(X_S, Y)$

Pertanyaan ini merupakan tindak lanjut dari: Keuntungan melakukan "laso ganda" atau melakukan laso dua kali?

regression optimization lasso regularization shrinkage Coca
sumber

Jawaban:

Dari definisi 1 Meinshausen (2007) , ada dua parameter yang mengendalikan solusi Lasso yang rileks.

Yang pertama, , mengontrol pemilihan variabel, sedangkan yang kedua, , mengontrol tingkat penyusutan. Ketika keduanya Lasso dan santai-Lasso adalah sama (seperti yang Anda katakan!), Tetapi untuk Anda mendapatkan solusi dengan koefisien lebih dekat dengan apa yang akan memberikan proyeksi ortogonal pada variabel yang dipilih (jenis soft de-biasing ). $\lambda$ $\phi$ $\phi= 1$ $\phi<1$

Formulasi ini sebenarnya sesuai untuk menyelesaikan dua masalah:

$\lambda$
$X_S$ $X$ $\lambda\phi$

Tonio Bonnef
sumber