Saya sedang membangun regresi logistik di R menggunakan metode LASSO dengan fungsi cv.glmnet
untuk memilih lambda
dan glmnet
untuk model akhir.
Saya sudah tahu semua kelemahan mengenai pemilihan model otomatis tetapi saya harus tetap melakukannya.
Masalah saya adalah bahwa saya perlu memasukkan variabel faktor (kategori) dalam model, apakah ada cara untuk melakukannya tanpa membuat banyak variabel dummy? Variabel ini hampir semua string dan bukan angka.
Jawaban:
glmnet tidak dapat mengambil faktor secara langsung, Anda perlu mengubah variabel faktor menjadi boneka. Ini hanya satu langkah sederhana menggunakan model.matrix, misalnya:
alpha = 1 akan membangun LASSO.
sumber