Saat ini saya sedang mengerjakan pembuatan model prediksi untuk hasil biner pada dataset dengan ~ 300 variabel dan 800 pengamatan. Saya telah membaca banyak di situs ini tentang masalah yang terkait dengan regresi bertahap dan mengapa tidak menggunakannya.
Saya telah membaca regresi LASSO dan kemampuannya untuk pemilihan fitur dan telah berhasil mengimplementasikannya dengan menggunakan paket "caret" dan "glmnet".
Saya dapat mengekstraksi koefisien model dengan optimal lambda
dan alpha
dari "caret"; Namun, saya tidak terbiasa dengan cara menafsirkan koefisien.
- Apakah koefisien LASSO ditafsirkan dalam metode yang sama dengan regresi logistik?
- Apakah pantas menggunakan fitur yang dipilih dari LASSO dalam regresi logistik?
EDIT
Interpretasi dari koefisien, seperti pada koefisien eksponensial dari regresi LASSO sebagai log odds untuk 1 unit perubahan koefisien sambil menahan semua koefisien lainnya konstan.
multiple-regression
predictive-models
interpretation
regression-coefficients
lasso
Michael Luu
sumber
sumber
Jawaban:
Biarkan saya ulangi: Apakah koefisien LASSO ditafsirkan dengan cara yang sama seperti, misalnya, koefisien kemungkinan maksimum
OLSdalam regresi logistik?LASSO (metode estimasi penalti) bertujuan untuk memperkirakan jumlah yang sama (koefisien model) seperti, katakanlah, kemungkinan maksimum
OLS(metode yang tidak diterapkan). Modelnya sama, dan interpretasinya tetap sama. Nilai numerik dari LASSO biasanya akan berbeda dari yang dari kemungkinan maksimumOLS: beberapa akan lebih dekat ke nol, yang lain akan persis nol. Jika sejumlah hukuman yang masuk akal telah diterapkan, estimasi LASSO akan lebih mendekati nilai sebenarnya daripada estimasi kemungkinan maksimumOLS, yang merupakan hasil yang diinginkan.Tidak ada masalah inheren dengan itu, tetapi Anda dapat menggunakan LASSO tidak hanya untuk pemilihan fitur tetapi juga untuk estimasi koefisien. Seperti yang saya sebutkan di atas, perkiraan LASSO mungkin lebih akurat daripada, katakanlah, perkiraan kemungkinan maksimum
OLS.sumber