Saya telah memasang model ARIMA (5,1,2) menggunakan auto.arima()
fungsi dalam R dan dengan melihat urutan kita dapat mengatakan ini bukan model terbaik untuk perkiraan. Jika outlier ada dalam seri data, apa metode untuk mencocokkan model dengan data tersebut?
r
time-series
forecasting
outliers
arima
Anthony
sumber
sumber
Jawaban:
Michael Chernick mengarahkan Anda ke arah yang benar. Saya juga akan melihat karya Ruey Tsay seperti yang ditambahkan ke tubuh pengetahuan ini. Lihat lebih lanjut di sini .
Anda tidak dapat bersaing dengan algoritma komputer otomatis saat ini. Mereka melihat banyak cara untuk mendekati deret waktu yang belum Anda pertimbangkan dan sering tidak didokumentasikan dalam kertas atau buku apa pun. Ketika seseorang bertanya bagaimana melakukan ANOVA, jawaban yang tepat dapat diharapkan ketika membandingkan dengan algoritma yang berbeda. Ketika seseorang mengajukan pertanyaan bagaimana saya melakukan pengenalan pola, banyak jawaban dimungkinkan karena heuristik terlibat. Pertanyaan Anda melibatkan penggunaan heuristik.
Cara terbaik untuk menyesuaikan model ARIMA, jika outlier ada dalam data adalah untuk mengevaluasi kemungkinan keadaan alam dan memilih pendekatan yang dianggap optimal untuk set data tertentu. Satu keadaan yang memungkinkan adalah proses ARIMA adalah sumber utama variasi yang dijelaskan. Dalam hal ini orang akan "mengidentifikasi tentatif" proses ARIMA melalui fungsi ACF / pacf dan kemudian memeriksa residu untuk kemungkinan outlier. Pencilan dapat berupa Pulsa, yaitu peristiwa satu kali ATAU pulsa musiman yang dibuktikan dengan pencilan sistematis pada beberapa frekuensi (misalnya, 12 untuk data bulanan). Jenis pencilan yang ketiga adalah di mana seseorang memiliki rangkaian pulsa yang berdekatan, masing-masing memiliki tanda dan besaran yang sama, ini disebut sebagai step atau level shift. Setelah memeriksa residu dari proses ARIMA tentatif seseorang kemudian dapat secara tentatif menambahkan struktur deterministik yang diidentifikasi secara empiris untuk membuat model gabungan tentatif. Atau jika sumber variasi utama adalah salah satu dari 4 jenis atau "outlier" maka seseorang akan lebih baik dilayani dengan mengidentifikasi mereka ab initio (pertama) dan kemudian menggunakan residu dari "model regresi" ini untuk mengidentifikasi struktur stokastik (ARIMA) . Sekarang dua strategi alternatif ini menjadi sedikit lebih rumit ketika seseorang memiliki "masalah" di mana parameter ARIMA berubah dari waktu ke waktu atau varians kesalahan berubah dari waktu ke waktu karena sejumlah kemungkinan penyebab, mungkin kebutuhan untuk kuadrat terkecil tertimbang atau transformasi daya seperti log / timbal balik, dll. Komplikasi lain / peluang adalah bagaimana dan kapan untuk membentuk kontribusi seri prediktor yang disarankan pengguna untuk membentuk model yang terintegrasi mulus menggabungkan memori, kausal dan seri dummy yang diidentifikasi secara empiris. Masalah ini semakin diperparah ketika seseorang memiliki seri trending dimodelkan terbaik dengan seri indikator bentuk0 , 0 , 0 , 0 , 1 , 2 , 3 , 4 , . . . , atau dan kombinasi seri level shift seperti . Anda mungkin ingin mencoba dan menulis prosedur seperti itu di R, tetapi hidup ini singkat. Saya akan senang untuk benar-benar menyelesaikan masalah Anda dan menunjukkan dalam hal ini bagaimana prosedurnya bekerja, silakan kirim data atau kirimkan ke [email protected]1 , 2 , 3 , 4 , 5 , . . . n 0 , 0 , 0 , 0 , 0 , 0 , 1 , 1 , 1 , 1 , 1
Komentar tambahan setelah menerima / menganalisis data / data harian untuk nilai tukar mata uang asing / 18 = 765 nilai mulai 1/1/2007
Data memiliki acf:
Setelah mengidentifikasi model arma dari bentuk dan sejumlah outlier acf dari residu menunjukkan keacakan karena nilai acf sangat kecil. AUTOBOX mengidentifikasi sejumlah pencilan:( 1 , 1 , 0 ) ( 0 , 0 , 0 )
Model terakhir:
termasuk kebutuhan untuk augmentasi stabilisasi varian a la TSAY di mana perubahan varians dalam residu diidentifikasi dan dimasukkan. Masalah yang Anda miliki dengan menjalankan otomatis Anda adalah bahwa prosedur yang Anda gunakan, seperti seorang akuntan, percaya data daripada menantang data melalui Intervensi Deteksi (alias, Deteksi Outlier). Saya telah memposting analisis lengkap di sini .
sumber
Tidak ada siap untuk menggunakan fungsi counterpart to arima yang kuat di R (belum) ; harus ada yang muncul, itu akan terdaftar di sini . Mungkin alternatifnya adalah menurunkan berat badan pengamatan yang mendekati sehubungan dengan aturan deteksi outlier sederhana univariat, tapi saya juga tidak melihat siap untuk menggunakan paket untuk menjalankan regresi ARMA tertimbang. Alternatif lain yang mungkin dilakukan adalah Winsorize poin-poin yang ada:
sumber
Ada literatur yang cukup besar tentang model deret waktu yang kuat. Martin dan Yohai adalah salah satu kontributor utama. Pekerjaan mereka kembali ke tahun 1980-an. Saya melakukan beberapa pekerjaan pada mendeteksi outlier dalam deret waktu, tetapi Martin benar-benar salah satu dari banyak kontributor untuk deteksi outlier dan estimasi parameter di hadapan outlier atau residu berekor berat dalam deret waktu.
sumber
Apakah tujuan model Anda untuk memperkirakan atau menganalisis sejarah? jika ini bukan untuk peramalan, dan Anda tahu bahwa ini adalah outlier, maka cukup tambahkan variabel dummy, yaitu 1 pada tanggal tersebut dan 0 pada tanggal lainnya. dengan cara ini koefisien dummy akan menangani outliers, dan Anda akan dapat menafsirkan koefisien lainnya dalam model.
jika ini untuk perkiraan, maka Anda harus bertanya pada diri sendiri dua pertanyaan: apakah pencilan ini akan terjadi lagi? jika mereka mau, apakah saya harus menjelaskannya?
Sebagai contoh, katakanlah seri data Anda memiliki outlier ketika Lehman brothers turun. itu adalah peristiwa yang Anda tidak punya cara untuk memprediksi, tentu saja, namun Anda tidak bisa mengabaikannya karena sesuatu seperti ini pasti akan terjadi di masa depan. jika Anda melempar boneka untuk outlier, maka Anda secara efektif menghapus ketidakpastian acara ini dari varians kesalahan. perkiraan Anda akan meremehkan risiko ekor - bukan hal yang baik, mungkin, untuk manajemen risiko. namun, jika Anda ingin membuat perkiraan penjualan awal, boneka itu akan berfungsi, karena Anda tidak tertarik pada ekornya, Anda tertarik pada skenario yang paling mungkin - jadi Anda tidak harus memperhitungkan peristiwa yang tidak terduga untuk tujuan ini.
Oleh karena itu, tujuan model Anda memengaruhi cara Anda berurusan dengan pencilan.
sumber