Perkiraan deret waktu Arima (auto.arima) dengan beberapa variabel eksogen di R

14

Saya ingin melakukan perkiraan berdasarkan beberapa seri ARIMA-model dengan beberapa variabel eksogen. Karena saya tidak begitu mahir dalam hal statistik dan RI tidak ingin menjaga sesederhana mungkin (Prakiraan tren selama 3 bulan sudah cukup).

Saya memiliki 1 deret waktu tergantung dan 3-5 deret waktu prediktor, semua data bulanan, tanpa celah, "cakrawala" waktu yang sama.

Saya menemukan fungsi auto.arima dan bertanya pada diri sendiri apakah ini akan menjadi solusi yang cocok untuk masalah saya. Saya memiliki harga komoditas berbeda dan harga produk dibuat dari mereka. Semua data mentah adalah non-stasioner tetapi melalui perbedaan orde pertama mereka semua menjadi data stasioner. ADF, KPSS menunjukkan ini. (Ini berarti saya telah menguji integrasi, kan?).

Pertanyaan saya sekarang adalah: Bagaimana cara saya menerapkan ini dengan fungsi auto.arima DAN apakah ARIMA pendekatan yang benar? Beberapa ppl sudah menyarankan saya untuk menggunakan VAR, tetapi apakah mungkin dengan ARIMA juga?

Tabel berikut adalah data saya. Sebenarnya set data naik hingga 105 pengamatan, tetapi 50 yang pertama akan dilakukan. Tren dan musiman jelas menarik di sini.

masukkan deskripsi gambar di sini

Terima kasih atas saran dan bantuannya! Georg

George
sumber
silakan kirim data Anda sehingga dapat diunduh. gunakan excel. Ini hanya bisa menjadi tugas untuk mengidentifikasi seri input yang tidak perlu (mungkin berkorelasi silang). Saya tidak berpikir bahwa VAR diperlukan atau Komponen Prinsip berguna untuk masalah ini
IrishStat

Jawaban:

10

Jika regresi eksternal Anda bersifat kausal untuk , tetapi tidak sebaliknya dan tidak menyebabkan satu sama lain, maka ARIMA pasti tepat. VAR masuk akal jika rangkaian waktu Anda yang berbeda semuanya bergantung satu sama lain.y

Agar auto.arima()dapat bekerja dengan regressor eksternal, kumpulkan regressor Anda ke dalam sebuah matriks X, yang Anda masukkan ke dalam xregparameter auto.arima(). (Tentu saja, Xharus memiliki jumlah baris yang sama dengan deret waktu yang yAnda modelkan.)

Untuk peramalan, Anda akan memerlukan nilai masa depan dari para regressor Anda, yang kemudian Anda masukkan lagi ke dalam xregparameter forecast.

Halaman bantuannya adalah ?auto.arimadan ?forecast.Arima(perhatikan ibukota A - ini bukan salah ketik. Jangan tanya saya ...).

Stephan Kolassa
sumber
1
(+1) Anda bisa menguraikan sedikit tentang ide kausalitas dan cara mengujinya. Mungkin bermanfaat untuk kelengkapan jawaban Anda, karena Anda menyebutkan bahwa keputusan untuk menggunakan ARIMA ditentukan oleh arah kausalitas di antara variabel-variabel. Apakah Anda misalnya berpikir tentang uji kausalitas Granger atau tes Hausman ? Terima kasih.
javlacalle
3
@javlacalle: Saya bukan penggemar tes statistik kausalitas (yang mana tes Granger paling terkenal). Saya lebih suka memutuskan tentang "kemungkinan kausalitas" berdasarkan materi pelajaran. Misalnya, saya tidak akan menggunakan tes Granger untuk menilai apakah penurunan harga meningkatkan penjualan supermarket atau sebaliknya. Juga apakah PDB, nilai tukar, dan penciptaan lapangan kerja adalah saling sebab akibat. Dalam kedua kasus, masalah tersebut tampak cukup jelas, dan tes yang sejalan dengan teori tidak akan mengajarkan apa pun kepada kita, sedangkan tes yang bertentangan dengan teori hanya akan membingungkan (dan mungkin tidak lebih dari kebisingan).
Stephan Kolassa
1
... Saya tahu bahwa saya membuka diri untuk berkobar dengan komentar terakhir saya ;-)
Stephan Kolassa
@ Stephan: Terima kasih atas masukan Anda. Meskipun y saya adalah definitley yang disebabkan oleh regressor saya dan bukan sebaliknya, tetapi regressor saya pasti berkorelasi satu sama lain dan juga harus memiliki dampak langsung lebih atau kurang satu sama lain. Menurut komentar Anda, ini berarti saya harus menggunakan VAR alih-alih arima, karena ini akan menghindari masalah (?). Saya menggunakan bundel harga komoditas / produk di sini, yang pada dasarnya semua terkait satu sama lain hingga titik tertentu. "Bahan baku" adalah Y saya, produk dari rantai nilai, serta produk samping, dll. Adalah prediktor saya.
George
1
Mengetahui konteks data selalu membantu dan hasil dari analisis apa pun harus dibandingkan dengan pengetahuan a priori kita. Meskipun demikian, beberapa kehati-hatian disarankan. Intuisi terkadang gagal dan teori-teori yang terkadang diterima begitu saja bergantung pada asumsi yang tidak didukung oleh fakta. Tapi saya mengerti apa yang Anda maksud dan setuju secara keseluruhan.
javlacalle