Metodologi Box-Jenkins adalah strategi atau prosedur yang dapat digunakan untuk membangun model ARIMA. Metodologi ini diuraikan dalam buku Time Series Analysis: Forecasting and Control oleh George EP Box dan Gwilym M. Jenkins, awalnya diterbitkan pada tahun 1970 - ada edisi yang lebih baru.
Dengan membuka SAS, memanggil proc ARIMA, dan menyediakan nomor untuk p, d, dan q, Anda hanya memperkirakan model ARIMA. Melakukan ini secara membabi buta, yaitu, dengan tidak menggunakan metodologi yang diakui khusus untuk mengidentifikasi model ARIMA itu sendiri, adalah seperti bermain dengan korek api - bahaya perangkat lunak!
Jika Anda terus mengulangi proses ini - memperkirakan banyak dan banyak model ARIMA - Anda pada akhirnya akan dapat memilih model dengan kriteria Informasi Akaike terendah (dari serangkaian model yang telah Anda perkirakan). Dalam konteks ini, pendekatan yang lebih sistematis adalah dengan menggunakan algoritma berdasarkan perbandingan nilai AIC untuk berbagai model yang berbeda untuk secara otomatis memilih model ARIMA untuk Anda, seperti yang disediakan oleh paket perkiraan dalam R - nama fungsi yang relevan adalah auto.arima()
.
Dalam setiap kejadian, prosedur yang Anda uraikan melibatkan pemilihan model ARIMA berdasarkan meminimalkan beberapa kriteria informasi (dalam hal ini, AIC, tetapi ada langkah-langkah lain). Ini adalah salah satu metodologi tertentu, tetapi itu bukan metodologi Box-Jenkins; sebuah alternatif.
Metodologi Box-Jenkins terdiri dari lima tahap (meskipun kadang-kadang dikatakan hanya melibatkan tiga tahap):
- Memeriksa stasioneritas atau non stasioneritas dan mentransformasikan data, jika perlu;
- Identifikasi model ARMA yang cocok;
- Estimasi parameter model yang dipilih;
- Pemeriksaan diagnostik kecukupan model; dan
- Peramalan, atau pengulangan langkah dua hingga lima.
Khususnya, ini adalah proses berulang yang melibatkan pembangun model melakukan beberapa penilaian - dan ini adalah salah satu aspek dari metodologi yang telah dianggap sebagai kekurangan. Bagian menghakimi ikut bermain terutama ketika menafsirkan dua alat; yaitu, fungsi estimasi autokorelasi (ACF) dan fungsi autokorelasi parsial (PACF).
Jika Anda ingin menjadi seorang praktisi metodologi Box-Jenkins, saya merekomendasikan untuk berkonsultasi dengan teks asli (Anda akan terkejut dengan apa yang dihilangkan oleh buku teks modern!) Di samping variasi modern apa pun yang dapat Anda temukan. Alan Pankratz memiliki beberapa buku pelajaran yang sangat bagus, yang juga sangat saya rekomendasikan; misalnya, Peramalan dengan Model Univariate Box-Jenkins: Konsep dan Kasus .
Pengalaman menunjukkan kepada saya bahwa istilah "metodologi Box-Jenkins" digunakan secara longgar karena saya mendengar beberapa orang menggunakannya untuk merujuk pada pembuatan model ARIMA secara umum - dan bukan pada proses aktual yang terlibat dalam membangun model ARIMA - sementara yang lain menggunakannya untuk merujuk ke versi modifikasi dari apa yang diterbitkan pada tahun 1970. Seperti yang ditunjukkan oleh @Glen_b, "ada banyak dokumen yang menggambarkan metodologi Box-Jenkins hari ini yang akan mencakup penggunaan AIC atau jumlah yang serupa" .
T: Apakah Anda seharusnya menggunakan metodologi Box-Jenkins untuk menghasilkan estimasi awal p, d, q?
Seperti yang telah disebutkan, ada strategi pemilihan model yang berbeda sehingga jawabannya tidak, itu tidak selalu berarti bahwa Anda perlu menggunakan metodologi Box-Jenkins, tetapi Anda bisa jika mau.
T: Apakah SAS menggunakannya secara internal?
Sangat tidak mungkin kecuali perangkat lunak itu menawarkan fungsi yang cukup canggih! Konsultasikan dengan dokumentasi SAS resmi untuk perincian tentang apa yang dilakukan atau mampu dilakukan oleh perangkat lunak. Jika itu R, Anda bisa melihat kode sumber, tapi saya ragu itu opsi dengan SAS.