Ketika saya menentukan lambda saya melalui validasi silang, semua koefisien menjadi nol. Tapi saya punya beberapa petunjuk dari literatur bahwa beberapa prediktor pasti akan mempengaruhi hasilnya. Apakah itu sampah untuk secara sewenang-wenang memilih lambda sehingga hanya ada sesedikit yang diinginkan seseorang?
Saya ingin memilih 10 atau lebih prediktor dari 135 untuk model cox dan ukuran efek sayangnya kecil.
Jawaban:
Jika Anda ingin memiliki setidaknya sejumlah prediktor dengan beberapa rentang nilai yang ditentukan oleh literatur, mengapa memilih pendekatan murni-LASSO untuk memulai? Seperti yang disarankan @probabilityislogic, Anda harus menggunakan beberapa prior informatif pada variabel-variabel di mana Anda memiliki pengetahuan tentang. Jika Anda ingin mempertahankan beberapa properti LASSO untuk sisa prediktor, mungkin Anda bisa menggunakan sebelumnya dengan distribusi eksponensial ganda untuk setiap input lainnya, yaitu, gunakan kepadatan bentuk manaλ
sumber
Ada cara yang bagus untuk melakukan LASSO tetapi gunakan sejumlah prediktor. Ini adalah Least angle regression (LAR atau LARS) yang dijelaskan dalam makalah Efron. Selama prosedur iteratif itu menciptakan sejumlah model linier, masing-masing yang baru memiliki satu lagi prediktor, sehingga Anda dapat memilih satu dengan jumlah prediktor yang diinginkan.
sumber
Teori laso bergantung pada parameter regularisasi yang cukup besar sehingga membuat model yang dipilih cukup jarang. Bisa jadi 10 fitur Anda terlalu banyak atau terlalu sedikit, karena tidak sepele untuk mengubah batas bawah pada menjadi batas atas pada.λ | S ∗ |λ λ |S∗|
Biarkan menjadi taksiran data-driven kami untuk , dan beri . Lalu, mungkin Anda mencoba memastikan bahwa sehingga Anda telah memulihkan setidaknya fitur yang relevan? Atau mungkin Anda mencoba membuktikan bahwa sehingga Anda tahu bahwa fitur yang Anda temukan semuanya berharga? Dalam kasus ini, prosedur Anda akan lebih dibenarkan jika Anda memiliki informasi sebelumnya tentang ukuran relatif . ß * S ={jβ^ β∗ S* ⊆ S S ⊆S*S*S^={j:β^j≠0} S∗⊆S^ S^⊆S∗ S∗
Juga, perhatikan, Anda dapat membiarkan beberapa koefisien tidak dilabeli ketika melakukan laso, misalnya
glmnet
,.sumber