Saya ingin meramalkan deret waktu non-stasioner, yang melibatkan beberapa asumsi a-priori penting setelah mempelajari contoh-contoh deret tersebut.
Saya telah membangun fungsi distribusi probabilitas satu titik rata-rata waktu yang diperkirakan oleh distribusi normal. Dari sudut pandang ini, saya ingin perkiraan tidak melebihi ini ketika . Dengan kata lain, varian harus dibatasi.
Fungsi distribusi probabilitas dua titik rata-rata juga telah dibangun, yang mengarah pada identifikasi fungsi autokorelasi. tersedia .
Pada awalnya, proses identifikasi Box-Jenkins membawa saya ke model
Saya tidak dapat membatasi varians sampai (yang mengikuti dari persamaan untuk bobot BJ ). Pada saat yang sama, saya tidak dapat menggunakan karena autokorelasi awal menurun secara perlahan (yang mungkin merupakan bukti non-stasioneritas menurut BJ). Ini adalah kendala utama bagi saya.
Secara visual, simulasi tidak sesuai dengan perilaku sampel saya. Dan korelasi dari perbedaan pertama dari seri berada dalam perjanjian yang buruk dengan korelasi berikut dari model.
Analisis residu menunjukkan korelasi yang signifikan mulai lag 3. Inilah sebabnya mengapa pernyataan awal saya tentang salah.
Mencoba menyesuaikan model yang berbeda, saya melihat bahwa ada korelasi residu yang signifikan dekat dengan lag untuk setiap . Dapat berasumsi bahwa saya memerlukan model (sebagai pilihan pembatas), misalnya ARIMA fraksional.
Dari [1] Saya telah belajar tentang Pecahan model yang berlaku.
Saya belum menemukan paket GNU R dengan dukungan nilai yang hilang untuk ini. Nilai-nilai yang hilang tampaknya menjadi semacam tantangan.
Publikasi pada ARIMA fraksional sangat jarang. Apakah model pecahan seperti itu benar-benar digunakan? Mungkin ada pengganti model ARIMA yang baik untuk kebutuhan saya? Peramalan bukan utama saya, saya hanya memiliki minat pragmatis.
Dari literatur yang berbeda (misalnya [2]), saya belajar bahwa secara praktis tidak mungkin untuk memutuskan antara ARIMA fraksional dan model dengan "pergeseran level". Namun, saya belum menemukan paket untuk GNU R agar sesuai dengan model 'level shift'.
[1]: Granger, Joyeux .: J. of time series anal. vol. 1 no. 1 1980, p.15
[2]: Grassi, de Magistris .: "Ketika memori lama memenuhi filter Kalman: Sebuah studi perbandingan", Statistik Komputasi dan Analisis Data, 2012, di media cetak.
Pembaruan: untuk membuat kemajuan saya sendiri dan untuk menjawab @IrishStat
Pernyataan saya tentang distribusi probabilitas dua titik secara umum tidak benar. Fungsi yang dibangun dengan cara ini akan tergantung pada panjang seri penuh. Jadi, ada sedikit yang bisa diekstrak dari ini. Setidaknya, parameter bernama akan tergantung pada panjang seri penuh.
Daftar 2 dan 3 juga telah diperbarui.
Data saya tersedia sebagai file dat di sini .
Saat ini, saya ragu antara FARIMA dan level shift, dan saya masih tidak dapat menemukan perangkat lunak yang sesuai untuk memeriksa opsi ini. Ini juga pengalaman pertama saya dengan identifikasi model, sehingga bantuan apa pun akan dihargai.
sumber
Jawaban:
Saya belum pernah melihat model seperti proses identifikasi Box-Jenkins membawa saya ke ARIMA (0,1,3) model TETAPI saya belum pernah melihat angsa hitam sampai saya pergi ke Australia. Silakan kirim data Anda karena mungkin menyarankan perlunya
Jika data Anda bersifat rahasia, cukup skala itu.
OK setelah menerima data Anda (sekitar 80000 bacaan), saya memilih 805 pengamatan mulai dari titik 6287 dan diperoleh.
. Titik perubahan signifikan terdeteksi pada periode 137 menunjukkan parameter yang bervariasi waktu. 668 pengamatan yang tersisa menunjukkan Model ARIMA pdq (3,0,0) dengan level.step shift mendukung kesimpulan awal Anda tentang lag 3 .. Grafik Aktual / Fit / Prakiraan adalah The Residual Plot dan acf dari residual adalah . Karena acf dari residu menunjukkan struktur yang kuat pada periode 5 dan 10, Anda dapat menyelidiki lebih lanjut struktur musiman pada lag 5. Saya harap ini membantu.
sumber