Kisaran lambda dalam regresi jaring elastis

9

Diberikan regresi net elastis

minb12||yXb||2+αλ||b||22+(1α)λ||b||1

bagaimana rentang λ dapat dipilih untuk validasi silang?

Dalam α=1 kasus (regresi ridge) rumus

dof=jsj2sj2+λ

dapat digunakan untuk memberikan derajat kebebasan yang setara untuk setiap lambda (di mana sj adalah nilai tunggal X ), dan derajat kebebasan dapat dipilih dalam rentang yang masuk akal.

Dalam kasus α=0 (laso) kita tahu itu

λ>λmaks=maksj|tytXtj|

akan menghasilkan semua bj menjadi nol, dan λ dapat dipilih dalam beberapa rentang (0,λmaks) .

Tetapi bagaimana menangani kasing campuran?

Chris Taylor
sumber

Jawaban:

4

Saya pikir Anda harus menggunakan rentang 0 hingga

λmaks=11-αλmaks

Alasan saya berasal dari memperpanjang kasus laso, dan derivasi penuh di bawah ini. adalah ia tidak menangkap batasan disumbangkan oleh regularisasi . Jika saya mencari cara untuk memperbaikinya (dan memutuskan apakah itu benar-benar perlu diperbaiki), saya akan kembali dan mengeditnya.dof2


Definisikan tujuan

f(b)=12y-Xb2+12γb2+δb1

Ini adalah tujuan yang Anda gambarkan, tetapi dengan beberapa parameter diganti untuk meningkatkan kejelasan.

Secara konvensional, hanya bisa menjadi solusi untuk masalah optimisasi jika gradien pada adalah nol. Namun istilah tidak mulus, jadi syaratnya adalah terletak pada subgradien pada .b=0minf(b)b=0b10b=0

Subgradien dari adalahf

f=-XT(y-Xb)+γb+δb1

di mana menunjukkan subgradient sehubungan dengan . Pada , ini menjadibb=0

f|b=0=-XTy+δ[-1,1]d

mana adalah dimensi , dan adalahdb[-1,1]dd kubus dimensi. Jadi untuk masalah pengoptimalan untuk memiliki solusi , harus seperti itub=0

(XTy)sayaδ[-1,1]

untuk setiap komponensaya . Ini setara dengan

δ>makssaya|jyjXsayaj|

yang merupakan definisi yang Anda berikan untuk . Jika sekarang ditukar, rumus dari atas pos keluar.λmaksδ=(1-α)λ

Andy Jones
sumber