Bagaimana cara saya memasukkan pencilan inovatif pada pengamatan 48 dalam model ARIMA saya?

10

Saya sedang mengerjakan kumpulan data. Setelah menggunakan beberapa teknik identifikasi model, saya keluar dengan model ARIMA (0,2,1).

Saya menggunakan detectIOfungsi dalam paket TSAdalam R untuk mendeteksi outlier inovatif (IO) pada pengamatan ke-48 set data asli saya.

Bagaimana cara memasukkan pencilan ini ke dalam model saya sehingga saya dapat menggunakannya untuk tujuan perkiraan? Saya tidak ingin menggunakan model ARIMAX karena saya mungkin tidak dapat membuat prediksi dari itu di R. Apakah ada cara lain saya bisa melakukan ini?

Berikut adalah nilai-nilai saya:

VALUE <- scan()
  4.6  4.5  4.4  4.5  4.4  4.6  4.7  4.6  4.7  4.7  4.7  5.0  5.0  4.9  5.1  5.0  5.4
  5.6  5.8  6.1  6.1  6.5  6.8  7.3  7.8  8.3  8.7  9.0  9.4  9.5  9.5  9.6  9.8 10.0
  9.9  9.9  9.8  9.8  9.9  9.9  9.6  9.4  9.5  9.5  9.5  9.5  9.8  9.3  9.1  9.0  8.9
  9.0  9.0  9.1  9.0  9.0  9.0  8.9  8.6  8.5  8.3  8.3  8.2  8.1  8.2  8.2  8.2  8.1
  7.8  7.9  7.8  7.8

Itu sebenarnya data saya. Mereka adalah tingkat pengangguran selama 6 tahun. Ada 72 pengamatan saat itu. Setiap nilai paling banyak satu desimal

b2amen
sumber
6
t=48
2
@ Gen_b Anda benar, itu seharusnya mengganggu Anda karena ini mungkin lebih dari perbedaan menghasilkan MA membatalkan (1). Kesalahan identifikasi disebabkan oleh penggunaan alat yang tidak pantas.
IrishStat
2
Dalam perbedaan kedua, Anda memiliki apa yang tampak seperti pencilan, tetapi tampaknya disebabkan oleh lompatan aditif kecil pada pengamatan 47 dalam seri asli, yang ketika dibedakan dua kali tampak seperti pencilan negatif besar satu periode kemudian. Jika Anda melakukan sesuatu yang sederhana untuk menghilangkan efek kecil itu pada pengamatan 47 (hampir semua hal masuk akal), tidak ada outlier yang muncul dalam perbedaan kedua. Saya akan mengatakan itu mungkin lebih baik dipandang sebagai AO pada skala asli.
Glen_b -Reinstate Monica
2
Ada banyak hal yang terjadi dalam dataset ini, tetapi perilaku temporal lokal (korelasi, musiman, dll) adalah yang paling sedikit. Ketika Anda secara buta menganalisis data seperti ini hanya sebagai urutan angka, Anda berisiko menghasilkan hasil yang konyol (atau lebih buruk). Apa yang bisa Anda ceritakan tentang apa arti data ini ? Apakah mereka mungkin mengukur sesuatu di stasiun pemantauan? Rangkaian waktu ekonomi? Grafik pertumbuhan biologis? Memahami sesuatu tentang fenomena yang mendasarinya biasanya akan melakukan jauh lebih banyak untuk membantu mengidentifikasi suatu model daripada jumlah yang bisa mengotak-atik perangkat lunak statistik.
whuber
2
@whuber: mereka adalah tingkat pengangguran selama 6 tahun!
b2amen

Jawaban:

3

Y(t)=[θ/ϕ][A(t)+IO(t)]Y*(t)=[θ/ϕ][A(t)]+[θ/ϕ][IO(t)]

θ=1ϕ=[1.5B]
Y*(t)=[1/(1.5B)][A(t)]
+IO(t).5IO(t1)+.25IO(t2).125IO(t3).


Y(t)=[1/(1.5B)][A(t)] +10IO(t)5IO(t1)+2.5IO(t2)1.25IO(t3).
IO

Dengan cara ini Anda dapat melihat bahwa dampak anomali tidak hanya bersifat instan tetapi juga memiliki memori.

t

[w(b)/d(b)][w(b)]

Setiap kali Anda memasukkan memori, baik itu hasil dari operator yang berbeda atau struktur ARMA, itu adalah pengakuan ketidaktahuan karena serangkaian sebab akibat yang dihilangkan. Ini juga berlaku pada kebutuhan untuk memasukkan rangkaian deterministik Intervensi seperti Pulsa / Pergeseran Level, Pulsa Musiman, atau Tren Waktu Lokal. Variabel dummy ini adalah proxy yang diperlukan untuk variabel kausal yang ditentukan pengguna determinstik yang dihilangkan. Seringkali yang Anda miliki adalah serangkaian minat dan mengingat kualifikasi yang telah saya sebutkan, Anda dapat meramalkan masa depan berdasarkan masa lalu dengan ketidaktahuan tentang sifat data yang dianalisis. Satu-satunya masalah adalah Anda menggunakan jendela belakang untuk memprediksi jalan di depan .... memang hal yang berbahaya.

setelah data diposting ...

Model yang masuk akal adalah a (1,1,0) masukkan deskripsi gambar di sinidan anomali AO diidentifikasi pada periode 39,41,47,21 dan 69 (bukan periode 48). Residu dari model ini tampaknya bebas dari struktur yang jelas. masukkan deskripsi gambar di siniDAN masukkan deskripsi gambar di siniAO fice menilai representasi optimal dari aktivitas yang dicerminkan oleh aktivitas yang tidak ada dalam sejarah deret waktu. Saya akan berpikir bahwa ACF dari model over-differencing OP akan mencerminkan ketidakcukupan model. Inilah modelnya. masukkan deskripsi gambar di sini Sekali lagi tidak ada kode R yang dikirimkan karena masalah atau peluang ada di ranah identifikasi model / revisi / validasi. Akhirnya sebidang seri aktual / pas dan yang diperkirakan.! [Masukkan deskripsi gambar di sini] [6]

IrishStat
sumber
1
terima kasih untuk balasan Anda; tetapi saya sebenarnya menginginkan R-Code sebagai gantinya untuk model saya.
b2amen
1
@ b2amen Ya saya menggarisbawahi TETAPI Glen_b menginginkan beberapa "barang" dan saya pikir saya akan menanggapinya.
IrishStat
Terima kasih telah mengedit. Anda dan saya akan menjadi mitra yang baik!
IrishStat
@ IrishStat: data saya termasuk dalam pertanyaan awal. Semoga itu bisa membantu Anda dalam membantu saya. Terima kasih anyways
b2amen
@IrishStat: Saya suka output Anda. Terlihat sangat rapi bagi saya. Dan perangkat lunak apa yang Anda gunakan? Tetapi bisakah Anda menjelaskan bagaimana Anda mengidentifikasi AR (2,1,0)? Terima kasih
b2amen