Pemilihan model Box-Jenkins

Prosedur pemilihan model Box-Jenkins dalam analisis deret waktu dimulai dengan melihat fungsi autokorelasi dan autokorelasi parsial dari seri tersebut. Plot ini dapat menyarankan dan sesuai dalam model ARMA . Prosedur berlanjut dengan meminta pengguna untuk menerapkan kriteria AIC / BIC untuk memilih model yang paling pelit di antara mereka yang menghasilkan model dengan istilah kesalahan white noise. $p$ $q$ $(p,q)$

Saya bertanya-tanya bagaimana langkah-langkah inspeksi visual dan pemilihan model berbasis kriteria ini berdampak pada estimasi kesalahan standar dari model akhir. Saya tahu bahwa banyak prosedur pencarian dalam domain cross-sectional dapat menyebabkan kesalahan standar ke bawah, misalnya.

Pada langkah pertama, bagaimana cara memilih jumlah jeda yang sesuai dengan melihat data (ACF / PACF) berdampak pada kesalahan standar untuk model deret waktu?

Saya akan menebak bahwa memilih model berdasarkan skor AIC / BIC akan berdampak analog dengan metode cross-sectional. Saya sebenarnya juga tidak tahu banyak tentang bidang ini, jadi komentar apa pun akan dihargai pada poin ini juga.

Terakhir, jika Anda menuliskan kriteria tepat yang digunakan untuk setiap langkah, dapatkah Anda mem-boot seluruh proses untuk memperkirakan kesalahan standar dan menghilangkan kekhawatiran ini?

regression time-series arima model-selection box-jenkins Charlie
sumber

Apakah bias dalam kesalahan standar (parameter?) sangat penting dalam model ARMA a-teoretis? Sebagian besar model ARMA ASFAIK digunakan untuk perkiraan jangka pendek. Masalah dengan interpretasi parameter dan sifat-sifatnya kurang (paling tidak?) Penting. Tentu saja jika Anda tidak memaksudkan karakteristik dari suatu proses inovasi (istilah kesalahan), merencanakan untuk menghasilkan interval prediksi yang relevan.

Dmitrij Celov

@ Dmitrij, Ada dua alasan utama mengapa saya khawatir tentang bias dalam kesalahan standar dari koefisien. Yang pertama, seperti yang Anda singgung, adalah penciptaan interval prediksi. Yang kedua adalah pengujian untuk kerusakan struktural dalam model, sebuah pertanyaan umum bahwa seorang ekonom akan tertarik untuk menjawab. Kesalahan standar yang dihasilkan menggunakan prosedur pemilihan harus terlalu kecil, memberikan interval prediksi yang terlalu sempit dan menguji statistik yang terlalu besar.

Charlie

tetapi dalam model a-teoretik (artinya tidak ada teori, tidak ada struktur), jeda struktural tidak ada hubungannya dengan parameter itu akan menjadi beberapa tes umum, mengenai perilaku residu model. Nah dalam hal ini estimasi parameter model yang tidak memihak kurang penting, ARMA tidak memiliki interpretasi model struktural. Jadi model pelit memang prediktor yang lebih baik, karena mereka menyeimbangkan sifat biasanya miskin dari penduga sampel kecil dan akurasi prediksi.

Dmitrij Celov

Perhatikan, bahwa bahkan jika Anda mengetahui proses pembuatan data yang memiliki banyak parameter, dalam sampel kecil model yang lebih sederhana mungkin akan melakukan prediksi yang lebih baik, tetapi dalam konteks struktural parameter model seperti itu akan sangat bias (dihilangkan bias variabel)!

Dmitrij Celov

Jawaban:

Prosedur pemilihan model apa pun akan memengaruhi kesalahan standar dan ini hampir tidak pernah diperhitungkan. Misalnya, interval prediksi dihitung secara kondisional pada model yang diestimasi dan estimasi parameter serta pemilihan model biasanya diabaikan.

Seharusnya dimungkinkan untuk mem-bootstrap seluruh prosedur untuk memperkirakan efek dari proses pemilihan model. Tetapi ingat bahwa bootstrap time series lebih sulit daripada bootstrap normal karena Anda harus mempertahankan korelasi serial. Bootstrap blok adalah salah satu pendekatan yang mungkin meskipun kehilangan beberapa korelasi serial karena struktur blok.

Rob Hyndman
sumber

Menurut pendapat saya memilih jumlah lag yang sesuai tidak berbeda dengan memilih jumlah seri input dalam prosedur regresi maju bertahap. Pentingnya kelambatan atau seri input tertentu adalah dasar untuk spesifikasi model tentatif.

Karena Anda telah menegaskan bahwa ACF / pacf adalah satu-satunya dasar untuk pemilihan model Box-Jenkins, izinkan saya memberi tahu Anda apa yang telah diajarkan beberapa pengalaman kepada saya. Jika suatu seri memperlihatkan suatu titik yang tidak membusuk, pendekatan Box-Jenkins (sekitar tahun 1965) menyarankan perbedaan data. Tetapi jika suatu seri memiliki pergeseran level, seperti data Nile , maka non-stationaritas yang "tampak secara visual" adalah gejala dari struktur yang dibutuhkan tetapi pembedaan bukanlah obatnya. Dataset Nile ini dapat dimodelkan tanpa membedakan dengan hanya mengidentifikasi kebutuhan untuk pergeseran tingkat terlebih dahulu. Dalam nada yang sama kita diajarkan menggunakan konsep 1960 bahwa jika ACF menunjukkan struktur musiman ( yaitunilai signifikan pada lag s, 2s, 3s, ...) maka kita harus memasukkan komponen ARIMA musiman. Untuk tujuan diskusi, pertimbangkan seri yang stasioner di sekitar rata-rata dan pada interval tetap, katakanlah setiap Juni ada "nilai tinggi". Seri ini diperlakukan dengan benar dengan memasukkan seri boneka "kuno" 0 dan 1 (pada Juni) untuk merawat struktur musiman. Model musiman ARIMA akan secara tidak tepat menggunakan memori alih-alih variabel X yang tidak ditentukan tetapi menunggu untuk ditemukan. Dua konsep ini mengidentifikasi / menggabungkan struktur deterministik yang tidak ditentukan adalah aplikasi langsung dari karya I. Chang, William Bell, George Tiao, R.Tsay , Chen et al (mulai tahun 1978) di bawah konsep umum Deteksi Intervensi.

Bahkan saat ini beberapa analis secara sembarangan melakukan strategi memaksimalkan memori, menyebutnya sebagai ARIMA Otomatis, tanpa mengakui bahwa "pemodelan memori tanpa pikiran" mengasumsikan bahwa struktur deterministik seperti pulsa, level shift, pulsa musiman dan tren waktu lokal tidak ada atau lebih buruk lagi tetapi tidak peran dalam identifikasi model. Ini mirip dengan menempatkan kepala seseorang di pasir, IMHO.

IrishStat
sumber

Terima kasih atas saran yang sangat baik tentang pemilihan model, tetapi saya tertarik pada bagaimana proses ini mempengaruhi kesimpulan kami sesudahnya.

Charlie

Charlie: Saya tidak percaya bahwa diagnosa data di muka seperti meninjau autokorelasi atau korelasi silang atau Prosedur Identifikasi Model lainnya seperti presentasi grafis memiliki efek pada signifikansi statistik dari setiap parameter yang diestimasi. Itulah pendapat saya dan "di sini saya berdiri saya tidak bisa melakukan yang lain". Terima kasih atas pujian dan jika saya dapat membantu Charlie muda dengan cara apa pun silakan menghubungi saya karena saya suka terdaftar sebagai sumber daya pendukung (tidak dibayar!) Dalam disertasi Phd.

IrishStat