Bisakah meningkat ketika

11

Jika β=argminβyXβ22+λβ1 , dapat β2 meningkat saat λ meningkat?

Saya pikir ini mungkin. Meskipun β1 tidak meningkat ketika λ meningkat ( bukti saya ), β2 dapat meningkat. Gambar di bawah ini menunjukkan kemungkinan. Ketika λ meningkat, jika β bergerak (linear) dari P ke Q , maka β2 meningkat sementara β1 berkurang. Tapi saya tidak tahu bagaimana membangun contoh konkret (yaitu, untuk membangun X dan y ), sehingga profil β menunjukkan perilaku ini. Ada ide? Terima kasih.

masukkan deskripsi gambar di sini

ziyuang
sumber

Jawaban:

10

Jawabannya adalah ya, dan Anda memiliki bukti grafis di di sana.2

Cari definisi kesetaraan norma vektor. Anda akan menemukan bahwa mana adalah dimensi vektor . Oleh karena itu, ada beberapa ruang gerak untuk norma , dibandingkan dengan norma .

x2x1nx2,
nx21

Faktanya, masalah yang ingin Anda selesaikan dapat dinyatakan sebagai:

Temukan sedemikian rupa sehingga pada saat yang bersamaan d

x+d2>x2
x+d1<x1.

ketimpangan pertama, perluas dan lihat bahwa dan itu, dengan mengasumsikan bahwa dan , kita memperoleh dari ketidaksetaraan kedua bahwa kita harus memiliki Setiap yang memenuhi batasan ini akan meningkatkan norma sambil menurunkan norma .

2ixidi>idi2
xi0xi+di0
idi<0.
d21

Dalam contoh Anda, , , dan dan d[0.4,0.3]Tx:=P[0.5,0.6]T

idi0.1<0,
2iPidi0.04>0.25idi2.
Tommy L
sumber
Tapi bagaimana hubungannya dengan konstruksi dan ? Xy
ziyuang
3

Terima kasih atas jawaban @ TommyL, tetapi jawabannya tidak langsung pada konstruksi dan . Saya entah bagaimana "memecahkan" ini sendiri. Pertama, ketika meningkat, tidak akan meningkat ketika setiap berkurang secara monoton. Ini terjadi ketika adalah ortonormal, di mana kita milikiXyλβ2βiX

βi=sign(βiLS)(βiLSλ)+

Secara geometris, dalam situasi ini bergerak tegak lurus dengan kontur norma , sehingga tidak dapat meningkat.β1β2

Sebenarnya, Hastie et al. disebutkan dalam makalah Maju regresi stagewise dan monoton laso , kondisi yang diperlukan dan cukup dari monotonitas jalur profil:

masukkan deskripsi gambar di sini

Dalam Bagian 6 dari makalah mereka membangun set data buatan berdasarkan fungsi dasar piecewise-linear yang melanggar kondisi di atas, menunjukkan non-monotonicity. Tetapi jika kita beruntung, kita juga dapat membuat set data acak yang menunjukkan perilaku yang sama tetapi dengan cara yang lebih sederhana. Ini kode R saya:

library(glmnet)
set.seed(0)
N <- 10
p <- 15
x1 <- rnorm(N)
X <- mat.or.vec(N, p)
X[, 1] <- x1
for (i in 2:p) {X[, i] <- x1 + rnorm(N, sd=0.2)}
beta <- rnorm(p, sd=10)
y <- X %*% beta + rnorm(N, sd=0.01)
model <- glmnet(X, y, family="gaussian", alpha=1, intercept=FALSE)

Saya sengaja membiarkan kolom sangat berkorelasi (jauh dari kasus orthonormal), dan true memiliki entri positif dan negatif yang besar. Ini profil (tidak mengherankan hanya 5 variabel yang diaktifkan):Xββ

masukkan deskripsi gambar di sini

dan hubungan antara dan :λβ2

masukkan deskripsi gambar di sini

Jadi kita dapat melihat bahwa untuk beberapa interval , meningkat seiring meningkat.λβ2λ

ziyuang
sumber