Regularisasi untuk model ARIMA

15

Saya mengetahui jenis LASSO, ridge, dan elastisitas-net dalam model regresi linier.

Pertanyaan:

  1. Bisakah estimasi jenis ini (atau sejenisnya) diterapkan pada pemodelan ARIMA (dengan bagian MA yang tidak kosong)?

Dalam membangun model ARIMA, tampaknya biasa untuk mempertimbangkan urutan lag maksimum yang dipilih sebelumnya ( pmax , qmax ) dan kemudian memilih beberapa urutan optimal ppmax dan qqmax misalnya dengan meminimalkan AIC atau AICc. Tetapi bisakah regularisasi digunakan sebagai gantinya?

Pertanyaan saya selanjutnya adalah:

  1. Bisakah kita memasukkan semua istilah hingga ( pmax , qmax ) tetapi menghukum ukuran koefisien (berpotensi sampai nol)? Apakah itu masuk akal?
  2. Jika mau, apakah itu sudah diterapkan di R atau perangkat lunak lain? Jika tidak, apa masalahnya?

Pos yang agak terkait dapat ditemukan di sini .

Richard Hardy
sumber
1
+1 untuk pertanyaan yang sangat bagus. Karena P, Q adalah nilai diskrit, mungkin lebih efisien untuk melakukan pencarian kisi untuk menemukan urutan P, Q yang optimal?
peramal
2
Saya senang Anda menyukainya! Ya, pencarian kotak adalah salah satu opsi dalam kerangka yang saya sebut sebagai "yang biasa". Di sana orang dapat mencari di grid kemungkinan kombinasi dari ( 0 , 0 ) hingga ( p m a x , q m a x ) . Namun, ini masih merupakan bagian dari "kerangka kerja biasa". Sebagai alternatif, saya tertarik untuk menjaga semua kelambatan tetapi menghukum ukuran koefisien. (p,q)(0,0)(pmax,qmax)
Richard Hardy
1
columbia.edu/~sn2294/papers/forecast.pdf Seharusnya LASSO bekerja lebih baik karena Anda dapat melewati beberapa kelambatan alih-alih menempatkan maksimum. Hal yang sama dapat dilakukan oleh AIC tetapi kemudian menjadi mahal secara komputasi.
Cagdas Ozgenc
1
@CagdasOzgenc, saya membaca sekilas kertas tetapi tampaknya tidak berurusan dengan regularisasi diterapkan pada model ARIMA (meskipun menyebutkan model ARMA dalam konteks kriteria informasi). Bisakah Anda tunjukkan bagian mana dari makalah yang relevan untuk pertanyaan saya?
Richard Hardy
1
5.3 tabel berisi model ARMAX. Hasilnya berlaku untuk model ARMA.
Cagdas Ozgenc

Jawaban:

9

Menjawab Pertanyaan 1.

Chen & Chan "Subset pilihan ARMA melalui adaptive Lasso" (2011) * menggunakan solusi untuk menghindari estimasi kemungkinan maksimum yang dikomputasi secara komputasi. Mengutip kertas, mereka

mengusulkan untuk menemukan model ARMA optimal bagian dengan memasang sebuah regresi Lasso adaptif dari time series pada kelambanan sendiri dan orang-orang dari residual yang diperoleh dari pas autoregresi panjang ke y t s. <...> [U] dalam kondisi keteraturan ringan, metode yang diusulkan mencapai sifat oracle, yaitu, ia mengidentifikasi model subset ARMA yang benar dengan probabilitas cenderung satu ketika ukuran sampel meningkat hingga tak terbatas, dan <...> estimator dari koefisien bukan nol secara asimptotik normal dengan distribusi pembatas sama dengan ketika koefisien nol diketahui secara apriori.ytyt

Secara opsional, mereka menyarankan estimasi kemungkinan maksimum dan diagnostik model untuk model ARMA subset terpilih.


L1

yt=l=1pΦlytl+m=1qΘmεtm+εt
pq

  • 1.5T||yy^||2F
    ε^:=yy^

  • yt=l=1p^Φlytl+m=1q^Θmε^tm+ut,

    p^q^1.5T

Pendekatan Wilms et al. adalah diimplementasikan dalam paket R "bigtime" .


Referensi


* Terima kasih kepada @hejseb untuk tautannya.

Richard Hardy
sumber
2
Kertas kerja ini sangat segar, diposting di arXiv baru kemarin.
Richard Hardy
Apakah ada implementasi dalam python atau R?
David Masip
@ Davidvidasi, lihat posting diperbarui untuk implementasi R.
Richard Hardy