Saya telah membaca bahwa grup laso digunakan untuk pemilihan variabel dan sparsity dalam kelompok variabel. Saya ingin tahu intuisi di balik klaim ini.
- Mengapa laso grup lebih disukai daripada laso?
- Mengapa jalur solusi laso grup tidak lurus linear?
regression
feature-selection
lasso
regularization
Vendetta
sumber
sumber
Jawaban:
Secara intuitif, laso grup dapat lebih disukai daripada laso karena menyediakan sarana bagi kami untuk memasukkan (jenis tertentu) informasi tambahan ke dalam perkiraan kami untuk koefisien sebenarnya . Sebagai skenario ekstrem, pertimbangkan hal berikut:β∗
Dengan , tuliskan sebagai dukungan dari . Pertimbangkan penaksir "oracle" yang merupakan grup laso dengan dua grup - satu dukungan dan satu pelengkap. Biarkan menjadi nilai terkecil dari yang membuat . Karena sifat penalti lasso grup, kita tahu bahwa pada bergerak dari ke (untuk beberapa orang kecily∼N(Xβ∗,σ2I) S={j:β∗j≠0} β∗
Dalam praktiknya, kami tidak memilih grup ini dengan baik. Namun, kelompok-kelompok itu, walaupun lebih baik daripada skenario ekstrem di atas, masih akan membantu kita: pilihan masih akan dibuat antara sekelompok kovariat sejati dan sekelompok kovariat tidak benar. Kami masih meminjam kekuatan.
Ini diformalkan di sini . Mereka menunjukkan, dalam beberapa kondisi, bahwa batas atas pada kesalahan prediksi laso grup lebih rendah daripada batas bawah pada kesalahan prediksi laso polos. Artinya, mereka membuktikan bahwa pengelompokan membuat estimasi kami lebih baik.
Untuk pertanyaan kedua Anda: Hukuman laso (polos) linier piecewise, dan ini memunculkan jalur solusi linear piecewise. Secara intuitif, dalam kasus laso grup, penalti tidak lagi linier, jadi kami tidak lagi memiliki properti ini. Referensi hebat tentang linearitas jalur solusi ada di sini . Lihat proposisi mereka 1. Biarkan dan . Mereka menunjukkan bahwa jalur solusi dari grup laso adalah linier jika dan hanya jika sama-sama konstan. Tentu saja, itu bukan karena penalti kami memiliki kelengkungan global.L(β)=∥y−Xβ∥22 J(β)=∑g∈G|g|1/2∥βg∥2
sumber
Jawaban Ben adalah hasil yang paling umum. Tetapi jawaban intuitif untuk OP dimotivasi oleh kasus prediktor kategori, yang biasanya dikodekan sebagai beberapa variabel dummy: satu untuk setiap kategori. Masuk akal dalam banyak analisis untuk mempertimbangkan variabel dummy ini (mewakili satu prediktor kategori) bersama-sama daripada secara terpisah.
Jika Anda memiliki variabel kategori dengan, katakanlah, lima level, laso lurus mungkin meninggalkan dua masuk dan tiga keluar. Bagaimana Anda menangani ini secara berprinsip? Putuskan untuk memilih? Secara harfiah menggunakan variabel dummy alih-alih kategori yang lebih bermakna? Bagaimana pengodean dummy Anda memengaruhi pilihan Anda?
Seperti yang mereka katakan dalam pengantar Lasso grup untuk regresi logistik , disebutkan:
Seperti yang ditunjukkan Ben, ada juga hubungan yang lebih halus antara para prediktor yang mungkin mengindikasikan bahwa mereka harus masuk atau keluar bersama. Tetapi variabel kategori adalah anak poster untuk laso kelompok.
sumber