Bagaimana cara memahami SARIMAX secara intuitif?

27

Saya mencoba memahami makalah tentang perkiraan beban listrik, tetapi saya berjuang dengan konsep di dalam, khususnya model SARIMAX . Model ini digunakan untuk memprediksi beban dan menggunakan banyak konsep statistik yang saya tidak mengerti (saya seorang mahasiswa ilmu komputer sarjana - Anda dapat menganggap saya orang awam dalam statistik). Tidak perlu bagi saya untuk memahami sepenuhnya cara kerjanya, tetapi saya ingin setidaknya memahami secara intuitif apa yang terjadi.

Saya telah mencoba untuk membagi SARIMAX menjadi bagian-bagian yang lebih kecil dan mencoba memahami masing-masing bagian secara terpisah dan kemudian menyatukannya. Bisakah kalian membantuku? Inilah yang saya miliki sejauh ini.

Saya mulai dengan AR dan MA.

AR : Autoregresif . Saya telah belajar apa itu regresi, dan dari pemahaman saya, itu hanya menjawab pertanyaan: diberikan seperangkat nilai / poin, bagaimana saya bisa menemukan model yang menjelaskan nilai-nilai ini? Jadi kita punya, misalnya, regresi linier, yang mencoba menemukan garis yang dapat menjelaskan semua poin ini. Autoregresi adalah regresi yang mencoba menjelaskan nilai menggunakan nilai sebelumnya.

MA : Rata-Rata Bergerak . Saya sebenarnya cukup tersesat di sini. Saya tahu apa itu moving average, tetapi model moving average tampaknya tidak ada hubungannya dengan moving average "normal". Rumus untuk model ini tampak canggung mirip dengan AR dan saya sepertinya tidak dapat memahami konsep apa pun yang saya temukan di internet. Apa tujuan MA? Apa perbedaan antara MA dan AR?

Jadi sekarang kita punya ARMA. The Saya kemudian datang dari Integrated , yang sejauh yang saya mengerti, hanya melayani tujuan yang memungkinkan model ARMA memiliki kecenderungan, baik meningkatkan atau menurunkan. (Apakah ini setara dengan mengatakan ARIMA memungkinkannya non-stasioner?)

Sekarang datang S dari musiman , yang menambahkan periodisitas ke ARIMA, yang pada dasarnya mengatakan, misalnya dalam hal peramalan beban, bahwa beban terlihat sangat mirip setiap hari pada jam 6 sore.

Akhirnya X , dari variabel eksogen , yang pada dasarnya memungkinkan variabel eksternal dipertimbangkan dalam model, seperti ramalan cuaca.

Jadi kami akhirnya memiliki SARIMAX! Apakah penjelasan saya baik-baik saja? Ketahuilah bahwa penjelasan ini tidak harus benar sepenuhnya. Bisakah seseorang menjelaskan kepada saya apa yang dilakukan MA secara intuitif?

Bentrokan
sumber
6
Intuisi Anda bahwa Moving Average Model tampaknya tidak ada hubungannya dengan Moving Average "normal" adalah suara. Lihat misalnya: Mengapa model seri waktu MA (q) disebut “moving averages”?
Graeme Walsh

Jawaban:

15

Seperti yang Anda catat, (1) model AR menghubungkan nilai pengamatan pada waktu dengan nilai sebelumnya, dengan beberapa kesalahan: Mari kita gantikan dengan , dan kemudian : Membawa itu hingga tak terbatas: Anda dapat menulis sembarang (stasioner) AR ( ) sebagai MA (t x t = ϕ x t - 1 + ε t x t - 1 x t - 2 x txt

xt=ϕxt-1+εt
xt-1xt-2
xt=ϕ(ϕxt-2+εt-1)+εt=ϕ2xt-2+ϕεt-1+εt=ϕ3xt-3+ϕ2εt-2+ϕεt-1+εt
xt=ϕnxt-n+ϕn-1εt-n+1+...+ϕεt-1+εt
hal ), meskipun tentu saja Anda mengalami tumpukan besar istilah di atas satu sama lain dengan .hal>1

Setelah melihat itu, mari kita ulangi definisi kita (1) sekarang. Proses AR menghubungkan nilai pengamatan pada waktu dengan urutan tak terbatas dari guncangan kesalahan peluruhan dari periode waktu sebelumnya (yang tidak kita amati secara langsung).xt ε

Jadi apa proses MA mungkin lebih jelas sekarang. (2) Proses MA ( ) mengaitkan nilai pengamatan pada waktu dengan hanya kejutan kejutan dari periode sebelumnya (yang tidak kita amati secara langsung), di mana koefisien dibolehkan bervariasi lebih dari eksponensial peluruhan implisit dalam model AR. Seperti yang Anda perhatikan, itu tidak ada hubungannya dengan konsep "moving average" yang biasa.qxtq

Dengan beberapa kondisi pada koefisien dari proses MA ( ), kita sebenarnya dapat melakukan sesuatu yang sangat mirip dengan apa yang saya tunjukkan untuk proses AR di atas, yaitu, menulis MA ( ) sebagai AR ( ). Jadi sama validnya untuk menyatakan kembali (2) untuk mengatakan proses MA menghubungkan nilai pengamatan pada waktu dengan urutan yang membusuk dari semua nilai sebelumnya .θ1...θqqqxtx

Jadi model ARMA hanya menggabungkan kedua ide tersebut, menghubungkan dengan urutan pembusukan tak terbatas dan urutan yang ditentukan. ARIMA hanya menambahkan perbedaan pada campuran, yaitu, Anda menjalankan ARMA pada (atau mungkin perbedaan lebih lanjut), untuk menghapus tren, seperti yang Anda catat.xtxt-xt-1

Affine
sumber
Halo Affine, terima kasih atas balasan cepatnya! Bisakah saya mengatakan MA seperti AR untuk kesalahan?
Clash
halq