Prosedur pemilihan model Box-Jenkins dalam analisis deret waktu dimulai dengan melihat fungsi autokorelasi dan autokorelasi parsial dari seri tersebut. Plot ini dapat menyarankan dan sesuai dalam model ARMA . Prosedur berlanjut dengan meminta pengguna untuk menerapkan kriteria AIC / BIC untuk memilih model yang paling pelit di antara mereka yang menghasilkan model dengan istilah kesalahan white noise.
Saya bertanya-tanya bagaimana langkah-langkah inspeksi visual dan pemilihan model berbasis kriteria ini berdampak pada estimasi kesalahan standar dari model akhir. Saya tahu bahwa banyak prosedur pencarian dalam domain cross-sectional dapat menyebabkan kesalahan standar ke bawah, misalnya.
Pada langkah pertama, bagaimana cara memilih jumlah jeda yang sesuai dengan melihat data (ACF / PACF) berdampak pada kesalahan standar untuk model deret waktu?
Saya akan menebak bahwa memilih model berdasarkan skor AIC / BIC akan berdampak analog dengan metode cross-sectional. Saya sebenarnya juga tidak tahu banyak tentang bidang ini, jadi komentar apa pun akan dihargai pada poin ini juga.
Terakhir, jika Anda menuliskan kriteria tepat yang digunakan untuk setiap langkah, dapatkah Anda mem-boot seluruh proses untuk memperkirakan kesalahan standar dan menghilangkan kekhawatiran ini?
Jawaban:
Prosedur pemilihan model apa pun akan memengaruhi kesalahan standar dan ini hampir tidak pernah diperhitungkan. Misalnya, interval prediksi dihitung secara kondisional pada model yang diestimasi dan estimasi parameter serta pemilihan model biasanya diabaikan.
Seharusnya dimungkinkan untuk mem-bootstrap seluruh prosedur untuk memperkirakan efek dari proses pemilihan model. Tetapi ingat bahwa bootstrap time series lebih sulit daripada bootstrap normal karena Anda harus mempertahankan korelasi serial. Bootstrap blok adalah salah satu pendekatan yang mungkin meskipun kehilangan beberapa korelasi serial karena struktur blok.
sumber
Menurut pendapat saya memilih jumlah lag yang sesuai tidak berbeda dengan memilih jumlah seri input dalam prosedur regresi maju bertahap. Pentingnya kelambatan atau seri input tertentu adalah dasar untuk spesifikasi model tentatif.
Karena Anda telah menegaskan bahwa ACF / pacf adalah satu-satunya dasar untuk pemilihan model Box-Jenkins, izinkan saya memberi tahu Anda apa yang telah diajarkan beberapa pengalaman kepada saya. Jika suatu seri memperlihatkan suatu titik yang tidak membusuk, pendekatan Box-Jenkins (sekitar tahun 1965) menyarankan perbedaan data. Tetapi jika suatu seri memiliki pergeseran level, seperti data Nile , maka non-stationaritas yang "tampak secara visual" adalah gejala dari struktur yang dibutuhkan tetapi pembedaan bukanlah obatnya. Dataset Nile ini dapat dimodelkan tanpa membedakan dengan hanya mengidentifikasi kebutuhan untuk pergeseran tingkat terlebih dahulu. Dalam nada yang sama kita diajarkan menggunakan konsep 1960 bahwa jika ACF menunjukkan struktur musiman ( yaitunilai signifikan pada lag s, 2s, 3s, ...) maka kita harus memasukkan komponen ARIMA musiman. Untuk tujuan diskusi, pertimbangkan seri yang stasioner di sekitar rata-rata dan pada interval tetap, katakanlah setiap Juni ada "nilai tinggi". Seri ini diperlakukan dengan benar dengan memasukkan seri boneka "kuno" 0 dan 1 (pada Juni) untuk merawat struktur musiman. Model musiman ARIMA akan secara tidak tepat menggunakan memori alih-alih variabel X yang tidak ditentukan tetapi menunggu untuk ditemukan. Dua konsep ini mengidentifikasi / menggabungkan struktur deterministik yang tidak ditentukan adalah aplikasi langsung dari karya I. Chang, William Bell, George Tiao, R.Tsay , Chen et al (mulai tahun 1978) di bawah konsep umum Deteksi Intervensi.
Bahkan saat ini beberapa analis secara sembarangan melakukan strategi memaksimalkan memori, menyebutnya sebagai ARIMA Otomatis, tanpa mengakui bahwa "pemodelan memori tanpa pikiran" mengasumsikan bahwa struktur deterministik seperti pulsa, level shift, pulsa musiman dan tren waktu lokal tidak ada atau lebih buruk lagi tetapi tidak peran dalam identifikasi model. Ini mirip dengan menempatkan kepala seseorang di pasir, IMHO.
sumber