Misalkan saya memiliki data longitudinal dari bentuk (Saya memiliki beberapa pengamatan, ini hanya bentuk yang tunggal). Saya tertarik pada pembatasan . tidak dibatasi setara dengan mengambil dengan .Σ Σ Y j = α j + j - 1 Σ ℓ = 1 φ ℓ j Y j - ℓ + ε j ε j ~ N ( 0 , σ j )
Ini biasanya tidak dilakukan karena memerlukan estimasi parameter kovarian . Sebuah model adalah "lag- " jika kita mengambil yaitu kita hanya menggunakan sebelumnya istilah untuk memprediksi dari riwayat.k Y j = α j + k ∑ ℓ = 1 ϕ ℓ j Y j - ℓ + ε j , k Y j
Yang benar-benar ingin saya lakukan adalah menggunakan semacam ide penyusutan untuk menghapus beberapa , seperti LASSO. Tapi masalahnya, saya juga ingin metode yang saya gunakan untuk memilih model yang lag- untuk beberapa ; Saya ingin menghukum keterlambatan pesanan lebih tinggi dari keterlambatan pemesanan lebih rendah. Saya pikir ini adalah sesuatu yang ingin kami lakukan mengingat prediktor sangat berkorelasi. k k
Masalah tambahan adalah bahwa jika (katakanlah) menyusut ke Saya juga ingin jika menyusut ke , yaitu jeda yang sama digunakan di semua distribusi kondisional. 0 ϕ 36 0
Saya bisa berspekulasi tentang ini, tetapi saya tidak ingin menemukan kembali rodanya. Apakah ada teknik LASSO yang dirancang untuk mengatasi masalah seperti ini? Apakah saya lebih baik hanya melakukan sesuatu yang sama sekali berbeda, seperti memasukkan lag order secara bertahap? Karena ruang model saya kecil, saya bahkan dapat menggunakan penalti untuk masalah ini.
Ini mencapai tujuan kedua dari koefisien zeroing out untuk lag tingkat tinggi, tetapi lebih ketat daripada pembatasan tunggal untuk memilih model lag lebih rendah. Dan seperti yang ditunjukkan orang lain, ini adalah pembatasan berat yang bisa sangat sulit untuk dibenarkan.
Setelah menghilangkan peringatan, makalah ini menyajikan hasil metode pada data time series nyata dan disimulasikan, dan algoritma detail untuk menemukan koefisien. Kesimpulannya menyebutkan paket R, tetapi makalah ini agak baru dan pencarian pada CRAN untuk "memerintahkan LASSO" muncul kosong, jadi saya menduga paket tersebut masih dalam pengembangan.
Makalah ini juga menawarkan pendekatan umum di mana dua parameter regularisasi "mendorong nyaris monotonisitas." (Lihat hal. 6.) Dengan kata lain, seseorang harus dapat menyetel parameter untuk memungkinkan pemesanan yang santai. Sayangnya, tidak ada contoh atau perbandingan metode santai yang diberikan. Tetapi, penulis menulis bahwa menerapkan perubahan ini adalah masalah sederhana untuk mengganti satu algoritma dengan yang lain, jadi orang berharap ini akan menjadi bagian dari paket R yang akan datang.
sumber
Penalti LASSO bersarang ( pdf ) dapat digunakan tetapi tidak ada paket R untuk itu.
sumber
Saya tahu Anda menulisnya sebagai premis, tetapi saya tidak akan menggunakan LASSO yang dipesan tanpa benar-benar yakin bahwa ini adalah hal yang diperlukan, karena asumsi dari LASSO yang dipesan tidak secara langsung sesuai untuk prediksi deret waktu. Sebagai contoh tandingan, pertimbangkan kasus di mana Anda memiliki waktu tunda, katakanlah, sepuluh langkah waktu antara pengukuran dan target. Jelas, batasan LASSO yang dipesan tidak dapat menangani efek seperti itu tanpa menghubungkan omong kosong dengan sembilan parameter pertama.
sumber