Saya mengerti bahwa jika suatu proses tergantung pada nilai sebelumnya dari dirinya sendiri, maka itu adalah proses AR. Jika itu tergantung pada kesalahan sebelumnya, maka itu adalah proses MA.
Kapan salah satu dari kedua situasi ini terjadi? Adakah yang punya contoh kuat yang menerangi masalah mendasar mengenai apa artinya bagi proses untuk dimodelkan sebagai MA vs AR?
time-series
autoregressive
moving-average
Matt O'Brien
sumber
sumber
Jawaban:
Salah satu hasil penting dan berguna adalah teorema representasi Wold (kadang-kadang disebut dekomposisi Wold), yang mengatakan bahwa setiap deret waktu kovarian stasioner dapat ditulis sebagai jumlah dari dua deret waktu, satu deterministik dan satu stokastik.Yt
Istilah kedua adalah MA tanpa batas.
(Ini juga merupakan kasus bahwa MA yang dapat dibalik dapat ditulis sebagai proses AR yang tak terbatas.)
Ini menunjukkan bahwa jika seri ini adalah kovarians-stasioner , dan jika kami menganggap Anda dapat mengidentifikasi bagian deterministik, maka Anda selalu dapat menulis bagian stokastik sebagai proses MA. Demikian pula jika MA memenuhi syarat keterbalikan Anda selalu dapat menuliskannya sebagai proses AR.
Jika Anda memiliki proses yang ditulis dalam satu formulir, Anda sering dapat mengonversinya ke formulir lain.
Jadi dalam satu hal setidaknya, untuk seri stasioner kovarians, seringkali AR atau MA akan sesuai.
Tentu saja, dalam praktiknya kami lebih suka tidak memiliki model yang sangat besar. Jika Anda memiliki AR atau MA terbatas, baik ACF dan PACF akhirnya membusuk secara geometris (ada fungsi geometris yang nilai absolut dari kedua fungsi akan berada di bawah), yang akan cenderung berarti bahwa perkiraan yang baik dari AR atau suatu MA dalam bentuk lain seringkali cukup pendek.
Jadi di bawah kondisi stasioner kovarian dan dengan asumsi kita dapat mengidentifikasi komponen deterministik dan stokastik, seringkali AR dan MA mungkin tepat.
Metodologi Box dan Jenkins mencari model pelit - model AR, MA atau ARMA dengan beberapa parameter. Biasanya ACF dan PACF digunakan untuk mencoba mengidentifikasi model, dengan mengubah ke stasioneritas (mungkin dengan membedakan), mengidentifikasi model dari penampilan ACF dan PACF (kadang-kadang orang menggunakan alat lain), menyesuaikan model dan kemudian memeriksa model. struktur residu (biasanya melalui ACF dan PACF pada residu) hingga deret residu tampak cukup konsisten dengan white noise. Seringkali akan ada beberapa model yang dapat memberikan perkiraan yang wajar untuk suatu seri. (Dalam praktiknya kriteria lain sering dipertimbangkan.)
Ada beberapa alasan untuk mengkritik pendekatan ini. Sebagai satu contoh, nilai-p yang dihasilkan dari proses berulang seperti itu umumnya tidak memperhitungkan cara model itu sampai (dengan melihat data); masalah ini mungkin setidaknya sebagian dihindari dengan pemisahan sampel, misalnya. Contoh kedua kritik adalah kesulitan untuk benar-benar mendapatkan seri stasioner - sementara orang mungkin dalam banyak kasus berubah untuk mendapatkan seri yang tampaknya cukup konsisten dengan stasioneritas, itu biasanya tidak akan menjadi kasus yang sebenarnya (masalah serupa adalah umum masalah dengan model statistik, meskipun mungkin terkadang lebih merupakan masalah di sini).
[Hubungan antara AR dan MA tak terbatas terkait dibahas dalam Peramalan Hyndman dan Athanasopoulos : prinsip dan praktik , di sini ]
sumber
Saya dapat memberikan apa yang menurut saya merupakan jawaban yang meyakinkan untuk bagian pertama dari pertanyaan ("dari mana MA?") Tetapi saat ini saya sedang memikirkan jawaban yang sama menariknya untuk bagian kedua dari pertanyaan ("di mana AR?").
Pertimbangkan seri yang terdiri dari harga penutupan (disesuaikan untuk pemisahan dan dividen) dari suatu saham pada hari-hari berturut-turut. Harga penutupan setiap hari berasal dari tren (misalnya, linear dalam waktu) ditambah efek tertimbang dari guncangan harian dari hari-hari sebelumnya. Agaknya, efek kejutan pada hari t-1 akan memiliki pengaruh yang lebih kuat pada harga pada hari t daripada kejutan pada hari t-2, dll. Dengan demikian, secara logis, harga penutupan saham pada hari t akan mencerminkan tren nilai pada hari t ditambah konstanta (kurang dari 1) kali jumlah bobot guncangan hingga hari t-1 (yaitu, istilah kesalahan pada hari t-1) (MA1), mungkin ditambah konstanta (kurang dari 1) kali jumlah guncangan tertimbang hingga hari t-2 (yaitu, istilah kesalahan pada hari t-2) (MA2), ..., ditambah kejutan baru pada hari t (white noise). Model semacam ini tampaknya cocok untuk seri pemodelan seperti pasar saham, di mana istilah kesalahan pada hari t mewakili jumlah tertimbang dari guncangan sebelumnya dan saat ini, dan mendefinisikan proses MA. Saya bekerja melalui alasan yang sama meyakinkan untuk proses AR-eksklusif.
sumber
Ini adalah contoh paling sederhana yang bisa saya buat untuk membantu memvisualisasikan proses AR, MA dan ARMA.
Perhatikan bahwa ini hanyalah bantuan visual untuk intro ke dalam subjek dan tidak cukup keras untuk menjelaskan semua kasus yang mungkin.
Asumsikan yang berikut ini: Kami memiliki dua agen dalam suatu kompetisi yang ditugaskan untuk melakukan tindakan tertentu (melompat secara horizontal ke kanan).
"Manusia" rata-rata diharapkan untuk menempuh jarak "μ" dengan standar deviasi "𝛿" dengan setiap lompatan sesuai kemampuan fisiknya. Namun, manusia sangat kurang dalam kekuatan mental :) dan kinerjanya juga tergantung pada apakah lompatan sebelumnya tertinggal / bertemu / melebihi harapannya.
"Mesin" telah dirancang dengan spesifikasi yang sama persis seperti manusia di atas dengan hanya satu perbedaan - mesin tidak memiliki emosi dan tidak terpengaruh oleh kinerja masa lalu.
Juga, Ada dua permainan yang harus dimainkan oleh kedua agen dengan masing-masing permainan melibatkan dua lompatan:
"Final Jump" mencetak berdasarkan jarak yang tercakup dalam lompatan terakhir setelah lompatan pemanasan yang hasilnya diabaikan dalam kompetisi tetapi tersedia bagi manusia untuk diamati. Lompatan terakhir dimulai saat lompatan pemanasan dimulai.
Skor "Combined Jump" berdasarkan jarak gabungan yang tercakup dalam lompatan awal dan akhir. Lompatan terakhir dimulai saat lompatan awal mendarat.
Bagan di bawah ini menunjukkan model mana yang paling baik menggambarkan masing-masing dari empat skenario yang terkait dengan aktor dan permainan di atas.
sumber
Jadi, Anda memiliki deret waktu univariat dan Anda ingin memodelkannya / memperkirakannya, bukan? Anda telah memilih untuk menggunakan model tipe ARIMA.
Parameter tergantung pada apa yang terbaik untuk dataset Anda. Tetapi bagaimana Anda mengetahuinya? Pendekatan baru-baru ini adalah "Peramalan seri waktu otomatis" oleh Hyndman & Khandakar (2008) ( pdf ).
Algoritma mencoba berbagai versi p, q, P dan Q dan memilih yang dengan AIC, AICc atau BIC terkecil. Ini diimplementasikan dalam fungsi auto.arima () dari paket R perkiraan . Pilihan kriteria informasi tergantung pada parameter yang Anda berikan ke fungsi.
Untuk model linier, memilih model dengan AIC terkecil dapat setara dengan validasi silang keluar-keluar-satu.
Anda juga harus memastikan bahwa Anda memiliki cukup data, setidaknya empat tahun.
Beberapa pemeriksaan penting:
Jawaban eksplisit untuk komentar Firebug di bawah ini: Saat data Anda mendukungnya.
sumber
"My question is, when would one of either of these two situations occur? "