Saya memiliki satu set data cuaca harian, yang memiliki, efek musiman sangat kuat, tidak mengejutkan.
Saya mengadaptasi model ARIMA ke kumpulan data ini menggunakan fungsi auto.arima dari paket perkiraan. Yang mengejutkan saya, fungsi ini tidak menerapkan operasi musiman - perbedaan musiman, komponen musiman atau komponen. Berikut adalah model yang diperkirakan:
library(forecast)
data<-ts(data,frequency=365)
auto.arima(Berlin)
Series: data
ARIMA(3,0,1) with non-zero mean
Coefficients:
ar1 ar2 ar3 ma1 intercept
1.7722 -0.9166 0.1412 -0.8487 283.0378
s.e. 0.0260 0.0326 0.0177 0.0214 1.7990
sigma^2 estimated as 5.56: log likelihood=-8313.74
AIC=16639.49 AICc=16639.51 BIC=16676.7
Dan juga perkiraan menggunakan model ini tidak terlalu memuaskan. Berikut adalah alur ramalannya:
Adakah yang bisa memberi saya petunjuk apa yang salah di sini?
r
time-series
forecasting
arima
arma
DatamineR
sumber
sumber
Jawaban:
R tidak akan cocok dengan model ARIMA dengan musim yang lebih besar dari 350. Lihat http://robjhyndman.com/hyndsight/longseasonality/ untuk diskusi tentang masalah ini. Solusinya adalah menggunakan istilah Fourier untuk musiman, dan kesalahan ARMA untuk dinamika jangka pendek.
sumber
Solusi untuk masalah Anda adalah seperti yang ditunjukkan Rob adalah menggabungkan efek deterministik (minggu dalam setahun) dan efek stokastik (struktur ARIMA) sambil mengisolasi hari-hari yang tidak biasa dan mendeteksi kemungkinan adanya satu atau lebih pergeseran level dan / atau satu atau lebih lokal tren waktu. AUTOBOX, perangkat lunak yang digunakan untuk analisis sebagian dikembangkan oleh saya untuk secara otomatis menyediakan pemodelan yang kuat untuk set data seperti ini.
Saya telah menempatkan data Anda di http://www.autobox.com/weather/weather.txt .
Acf dari data asli adalah yang mengarah pada pemilihan model formulir secara otomatis . Statistik model dengan plot residual Plot perkiraan untuk 60 hari berikutnya disajikan di sini Grafik Aktual / Fit / Prakiraan ditampilkan di sini.
Mungkin menarik bagi orang lain untuk mengikuti saran Prof. Hyndaman dan melaporkan model akhir mereka dengan pemeriksaan disgnostik mengenai diagnostik residual dan uji parameter penting.
Saya pribadi tidak nyaman dengan saran tentang pertama melakukan analisis fourier (mungkin / mungkin dipengaruhi oleh anomali) dan kemudian melakukan ARIMA pada residu tidak dapat diterima karena itu bukan solusi simultan yang mengarah ke 1 persamaan melainkan urutan dugaan. Persamaan saya menggunakan minggu-bulan-bulan dan juga termasuk AR (1) dan solusi untuk poin data yang tidak biasa.
Semua perangkat lunak memiliki keterbatasan dan baik untuk mengetahuinya. Sekali lagi saya tegaskan mengapa tidak ada yang mencoba menerapkan saran Rob dan menunjukkan hasil lengkap.
sumber