auto.arima tidak mengenali pola musiman

8

Saya memiliki satu set data cuaca harian, yang memiliki, efek musiman sangat kuat, tidak mengejutkan.

masukkan deskripsi gambar di sini

Saya mengadaptasi model ARIMA ke kumpulan data ini menggunakan fungsi auto.arima dari paket perkiraan. Yang mengejutkan saya, fungsi ini tidak menerapkan operasi musiman - perbedaan musiman, komponen musiman atau komponen. Berikut adalah model yang diperkirakan:

library(forecast)
data<-ts(data,frequency=365)
auto.arima(Berlin)

Series: data
ARIMA(3,0,1) with non-zero mean 

Coefficients:
         ar1      ar2     ar3      ma1  intercept
      1.7722  -0.9166  0.1412  -0.8487   283.0378
s.e.  0.0260   0.0326  0.0177   0.0214     1.7990

sigma^2 estimated as 5.56:  log likelihood=-8313.74
AIC=16639.49   AICc=16639.51   BIC=16676.7

Dan juga perkiraan menggunakan model ini tidak terlalu memuaskan. Berikut adalah alur ramalannya: masukkan deskripsi gambar di sini

Adakah yang bisa memberi saya petunjuk apa yang salah di sini?

DatamineR
sumber
Bisakah Anda memposting kode (atau contoh serupa) yang Anda gunakan untuk mendapatkan output?
rbatt
Halo rbat, saya memposting kode yang saya gunakan. Data mentah disimpan di bawah 'data'. Saya mengonversinya menjadi objek ts pertama
DatamineR
Koefisien MA (1) Anda (-.84) secara mencurigakan mendekati -1 batas pembalikan yang menunjukkan (kepada saya) bahwa Anda telah memberlakukan spesifikasi model yang buruk pada data yang tidak curiga. Harap berikan tautan ke data mentah yang sebenarnya dan saya akan mencoba dan membantu Anda menggunakan pendekatan yang lebih canggih daripada yang Anda akses saat ini. Mungkin menjelaskan solusi yang Anda butuhkan.
IrishStat
IrishStat terima kasih atas tawarannya! Saya hanya bingung mengapa 'auto.arima' tidak memperkirakan di sini model musiman, meskipun musiman jelas. Jika saya harus memperkirakan model di sini, saya mungkin akan menghapus musiman dengan metode Fourier atau hanya musiman (dalam hal ini dengan lag = 365) perbedaan data. Tetapi bukankah seharusnya 'auto.arima' melakukan pembedaan yang tepat? Saya mencoba melampirkan data, tetapi tidak menemukan kemungkinan untuk melakukannya. Bagaimana seseorang bisa memasukkan data dalam pertanyaan?
DatamineR
Jika mau, Anda dapat mengirim saya email. Lampirkan file excel dengan info tanggal mulai dan saya akan mempostingnya ke grup. Silakan lihat info kontak saya untuk mendapatkan alamat email saya.
IrishStat

Jawaban:

11

R tidak akan cocok dengan model ARIMA dengan musim yang lebih besar dari 350. Lihat http://robjhyndman.com/hyndsight/longseasonality/ untuk diskusi tentang masalah ini. Solusinya adalah menggunakan istilah Fourier untuk musiman, dan kesalahan ARMA untuk dinamika jangka pendek.

Rob Hyndman
sumber
7

Solusi untuk masalah Anda adalah seperti yang ditunjukkan Rob adalah menggabungkan efek deterministik (minggu dalam setahun) dan efek stokastik (struktur ARIMA) sambil mengisolasi hari-hari yang tidak biasa dan mendeteksi kemungkinan adanya satu atau lebih pergeseran level dan / atau satu atau lebih lokal tren waktu. AUTOBOX, perangkat lunak yang digunakan untuk analisis sebagian dikembangkan oleh saya untuk secara otomatis menyediakan pemodelan yang kuat untuk set data seperti ini.

Saya telah menempatkan data Anda di http://www.autobox.com/weather/weather.txt .

Acf dari data asli adalah masukkan deskripsi gambar di siniyang mengarah pada pemilihan model formulir secara otomatis masukkan deskripsi gambar di sini masukkan deskripsi gambar di sini masukkan deskripsi gambar di sini. Statistik model masukkan deskripsi gambar di sinidengan plot residual Plot masukkan deskripsi gambar di siniperkiraan untuk 60 hari berikutnya disajikan di sini masukkan deskripsi gambar di sini Grafik Aktual / Fit / Prakiraan ditampilkan di sini.masukkan deskripsi gambar di sini

Mungkin menarik bagi orang lain untuk mengikuti saran Prof. Hyndaman dan melaporkan model akhir mereka dengan pemeriksaan disgnostik mengenai diagnostik residual dan uji parameter penting.

Saya pribadi tidak nyaman dengan saran tentang pertama melakukan analisis fourier (mungkin / mungkin dipengaruhi oleh anomali) dan kemudian melakukan ARIMA pada residu tidak dapat diterima karena itu bukan solusi simultan yang mengarah ke 1 persamaan melainkan urutan dugaan. Persamaan saya menggunakan minggu-bulan-bulan dan juga termasuk AR (1) dan solusi untuk poin data yang tidak biasa.

Semua perangkat lunak memiliki keterbatasan dan baik untuk mengetahuinya. Sekali lagi saya tegaskan mengapa tidak ada yang mencoba menerapkan saran Rob dan menunjukkan hasil lengkap.

IrishStat
sumber