Hai teman-teman, saya menemukan satu atau dua makalah yang menggunakan regresi ridge (untuk data bola basket). Saya selalu diminta untuk menstandardisasi variabel saya jika saya menjalankan regresi punggungan, tetapi saya hanya diminta untuk melakukan ini karena punggungan adalah varian skala (regresi punggungan tidak benar-benar bagian dari kursus kami, jadi dosen kami membaca skalanya).
Makalah-makalah ini saya baca tidak membakukan variabel mereka, yang saya temukan sedikit mengejutkan. Mereka juga berakhir dengan nilai-nilai besar lambda (sekitar level 2000-4000) melalui cross-validation, dan saya diberitahu bahwa ini adalah karena tidak menstandarisasi variabel.
Bagaimana tepatnya meninggalkan variabel yang tidak standar mengarah ke nilai lambda yang tinggi dan juga, apa konsekuensi dari tidak menstandarkan variabel secara umum? Apakah ini benar-benar masalah besar?
Bantuan apa pun sangat kami hargai.
sumber
Meskipun terlambat empat tahun, saya harap seseorang akan mendapat manfaat dari ini .... Cara saya memahaminya, coeff adalah berapa banyak variabel target perubahan untuk perubahan unit dalam variabel independen (dy / dx). Mari kita asumsikan kita sedang mempelajari hubungan antara berat dan tinggi dan berat diukur dalam Kg. Ketika kita menggunakan Kilometer untuk ketinggian, Anda bisa membayangkan sebagian besar titik data (untuk ketinggian manusia) dikemas dengan cermat. Jadi, untuk perubahan fraksional kecil tinggi akan ada perubahan besar berat (dengan asumsi kenaikan berat badan dengan tinggi). Rasio dy / dx akan sangat besar. Di sisi lain, jika ketinggian diukur dalam milimeter, data akan tersebar jauh dan luas pada atribut ketinggian. Satuan perubahan tinggi badan tidak akan memiliki perubahan berat dy / dx yang signifikan akan sangat kecil hampir mendekati 0.
sumber