Dalam keadaan apa proses MA atau proses AR sesuai?

21

Saya mengerti bahwa jika suatu proses tergantung pada nilai sebelumnya dari dirinya sendiri, maka itu adalah proses AR. Jika itu tergantung pada kesalahan sebelumnya, maka itu adalah proses MA.

Kapan salah satu dari kedua situasi ini terjadi? Adakah yang punya contoh kuat yang menerangi masalah mendasar mengenai apa artinya bagi proses untuk dimodelkan sebagai MA vs AR?

Matt O'Brien
sumber
3
Tidak semudah dikotomi seperti itu; setelah semua, sebuah AR dapat ditulis sebagai MA yang tak terbatas dan MA (yang tidak dapat dibalik) dapat ditulis sebagai AR yang tak terbatas, jadi jika salah satu dari keduanya sesuai, bisa dibilang demikian pula yang lain.
Glen_b -Reinstate Monica
1
Glen_b, bisakah Anda menjelaskan hal ini? Saya mengerti itu bukan dikotomi sederhana ... apakah saya benar berasumsi (berharap, bahkan) bahwa ada sesuatu yang layak dibongkar di sini? Saya tidak ingin hanya menjalankan ACF / pacf dan berpura-pura memiliki pemahaman yang baik tentang proses ini.
Matt O'Brien
Sangat banyak terkait: Contoh kehidupan nyata dari proses rata-rata bergerak
S. Kolassa - Reinstate Monica

Jawaban:

10

Salah satu hasil penting dan berguna adalah teorema representasi Wold (kadang-kadang disebut dekomposisi Wold), yang mengatakan bahwa setiap deret waktu kovarian stasioner dapat ditulis sebagai jumlah dari dua deret waktu, satu deterministik dan satu stokastik.Yt

Yt=μt+j=0bjεt-j ,, di mana bersifat deterministik.μt

Istilah kedua adalah MA tanpa batas.

(Ini juga merupakan kasus bahwa MA yang dapat dibalik dapat ditulis sebagai proses AR yang tak terbatas.)

Ini menunjukkan bahwa jika seri ini adalah kovarians-stasioner , dan jika kami menganggap Anda dapat mengidentifikasi bagian deterministik, maka Anda selalu dapat menulis bagian stokastik sebagai proses MA. Demikian pula jika MA memenuhi syarat keterbalikan Anda selalu dapat menuliskannya sebagai proses AR.

Jika Anda memiliki proses yang ditulis dalam satu formulir, Anda sering dapat mengonversinya ke formulir lain.

Jadi dalam satu hal setidaknya, untuk seri stasioner kovarians, seringkali AR atau MA akan sesuai.

Tentu saja, dalam praktiknya kami lebih suka tidak memiliki model yang sangat besar. Jika Anda memiliki AR atau MA terbatas, baik ACF dan PACF akhirnya membusuk secara geometris (ada fungsi geometris yang nilai absolut dari kedua fungsi akan berada di bawah), yang akan cenderung berarti bahwa perkiraan yang baik dari AR atau suatu MA dalam bentuk lain seringkali cukup pendek.

Jadi di bawah kondisi stasioner kovarian dan dengan asumsi kita dapat mengidentifikasi komponen deterministik dan stokastik, seringkali AR dan MA mungkin tepat.

Metodologi Box dan Jenkins mencari model pelit - model AR, MA atau ARMA dengan beberapa parameter. Biasanya ACF dan PACF digunakan untuk mencoba mengidentifikasi model, dengan mengubah ke stasioneritas (mungkin dengan membedakan), mengidentifikasi model dari penampilan ACF dan PACF (kadang-kadang orang menggunakan alat lain), menyesuaikan model dan kemudian memeriksa model. struktur residu (biasanya melalui ACF dan PACF pada residu) hingga deret residu tampak cukup konsisten dengan white noise. Seringkali akan ada beberapa model yang dapat memberikan perkiraan yang wajar untuk suatu seri. (Dalam praktiknya kriteria lain sering dipertimbangkan.)

Ada beberapa alasan untuk mengkritik pendekatan ini. Sebagai satu contoh, nilai-p yang dihasilkan dari proses berulang seperti itu umumnya tidak memperhitungkan cara model itu sampai (dengan melihat data); masalah ini mungkin setidaknya sebagian dihindari dengan pemisahan sampel, misalnya. Contoh kedua kritik adalah kesulitan untuk benar-benar mendapatkan seri stasioner - sementara orang mungkin dalam banyak kasus berubah untuk mendapatkan seri yang tampaknya cukup konsisten dengan stasioneritas, itu biasanya tidak akan menjadi kasus yang sebenarnya (masalah serupa adalah umum masalah dengan model statistik, meskipun mungkin terkadang lebih merupakan masalah di sini).

[Hubungan antara AR dan MA tak terbatas terkait dibahas dalam Peramalan Hyndman dan Athanasopoulos : prinsip dan praktik , di sini ]

Glen_b -Reinstate Monica
sumber
1
-1 karena, meskipun agak menarik, itu tidak benar-benar menjawab semangat pertanyaan.
Jake Westfall
Hai Jake - terima kasih telah menambahkan komentar tentang apa yang menurut Anda salah dengan jawabannya. Ini jauh lebih bermanfaat daripada downvote sendiri. Saya setuju ada sesuatu yang kurang di sini - setidaknya harus dijelaskan mengapa saya pikir itu cukup relevan untuk dikirim sebagai jawaban.
Glen_b -Reinstate Monica
1
@ jake Saya telah membuat beberapa pengeditan yang saya harap membuat koneksi ke pertanyaan menjadi lebih jelas. Terima kasih sekali lagi atas bantuan Anda
Glen_b -Reinstate Monica
Terima kasih atas hasil editnya. Saya menghapus downvote saya. Kondensasi satu kalimat saya untuk jawaban yang telah direvisi Anda akan menjadi seperti: "Ini adalah pertanyaan yang sulit dijawab secara umum karena, dalam banyak kasus, baik model AR atau MA dapat sesuai dengan data seperti halnya yang lain. " Yang merupakan respon sah, jika mengecewakan, terhadap pertanyaan.
Jake Westfall
@Jake tidak merasa perlu untuk menghapus downvote jika Anda masih memiliki reservasi; Saya menghargai kesempatan untuk meningkatkan jawaban.
Glen_b -Reinstate Monica
5

Saya dapat memberikan apa yang menurut saya merupakan jawaban yang meyakinkan untuk bagian pertama dari pertanyaan ("dari mana MA?") Tetapi saat ini saya sedang memikirkan jawaban yang sama menariknya untuk bagian kedua dari pertanyaan ("di mana AR?").

Pertimbangkan seri yang terdiri dari harga penutupan (disesuaikan untuk pemisahan dan dividen) dari suatu saham pada hari-hari berturut-turut. Harga penutupan setiap hari berasal dari tren (misalnya, linear dalam waktu) ditambah efek tertimbang dari guncangan harian dari hari-hari sebelumnya. Agaknya, efek kejutan pada hari t-1 akan memiliki pengaruh yang lebih kuat pada harga pada hari t daripada kejutan pada hari t-2, dll. Dengan demikian, secara logis, harga penutupan saham pada hari t akan mencerminkan tren nilai pada hari t ditambah konstanta (kurang dari 1) kali jumlah bobot guncangan hingga hari t-1 (yaitu, istilah kesalahan pada hari t-1) (MA1), mungkin ditambah konstanta (kurang dari 1) kali jumlah guncangan tertimbang hingga hari t-2 (yaitu, istilah kesalahan pada hari t-2) (MA2), ..., ditambah kejutan baru pada hari t (white noise). Model semacam ini tampaknya cocok untuk seri pemodelan seperti pasar saham, di mana istilah kesalahan pada hari t mewakili jumlah tertimbang dari guncangan sebelumnya dan saat ini, dan mendefinisikan proses MA. Saya bekerja melalui alasan yang sama meyakinkan untuk proses AR-eksklusif.

Mahasiswa
sumber
3
+1. Ini adalah satu-satunya jawaban sejauh ini yang bahkan mencoba menjawab pertanyaan awal.
S. Kolassa - Reinstate Monica
Jika saya memahaminya dengan benar, sepertinya proses AR lebih baik untuk mengoreksi tren yang berulang, tetapi MA lebih baik untuk mengoreksi guncangan besar yang tidak berulang.
Mike Campbell
0

Ini adalah contoh paling sederhana yang bisa saya buat untuk membantu memvisualisasikan proses AR, MA dan ARMA.

Perhatikan bahwa ini hanyalah bantuan visual untuk intro ke dalam subjek dan tidak cukup keras untuk menjelaskan semua kasus yang mungkin.

Asumsikan yang berikut ini: Kami memiliki dua agen dalam suatu kompetisi yang ditugaskan untuk melakukan tindakan tertentu (melompat secara horizontal ke kanan).

  1. "Manusia" rata-rata diharapkan untuk menempuh jarak "μ" dengan standar deviasi "𝛿" dengan setiap lompatan sesuai kemampuan fisiknya. Namun, manusia sangat kurang dalam kekuatan mental :) dan kinerjanya juga tergantung pada apakah lompatan sebelumnya tertinggal / bertemu / melebihi harapannya.

  2. "Mesin" telah dirancang dengan spesifikasi yang sama persis seperti manusia di atas dengan hanya satu perbedaan - mesin tidak memiliki emosi dan tidak terpengaruh oleh kinerja masa lalu.

Juga, Ada dua permainan yang harus dimainkan oleh kedua agen dengan masing-masing permainan melibatkan dua lompatan:

  1. "Final Jump" mencetak berdasarkan jarak yang tercakup dalam lompatan terakhir setelah lompatan pemanasan yang hasilnya diabaikan dalam kompetisi tetapi tersedia bagi manusia untuk diamati. Lompatan terakhir dimulai saat lompatan pemanasan dimulai.

  2. Skor "Combined Jump" berdasarkan jarak gabungan yang tercakup dalam lompatan awal dan akhir. Lompatan terakhir dimulai saat lompatan awal mendarat.

Bagan di bawah ini menunjukkan model mana yang paling baik menggambarkan masing-masing dari empat skenario yang terkait dengan aktor dan permainan di atas.

Diagram yang menggambarkan perbedaan antara proses AR, MA dan ARMA

CodeWarrior
sumber
Poster ini perlu penjelasan dan konteks agar dapat dipahami. Bisakah Anda memberikan itu dalam jawaban Anda?
whuber
-1

Jadi, Anda memiliki deret waktu univariat dan Anda ingin memodelkannya / memperkirakannya, bukan? Anda telah memilih untuk menggunakan model tipe ARIMA.

Parameter tergantung pada apa yang terbaik untuk dataset Anda. Tetapi bagaimana Anda mengetahuinya? Pendekatan baru-baru ini adalah "Peramalan seri waktu otomatis" oleh Hyndman & Khandakar (2008) ( pdf ).

Algoritma mencoba berbagai versi p, q, P dan Q dan memilih yang dengan AIC, AICc atau BIC terkecil. Ini diimplementasikan dalam fungsi auto.arima () dari paket R perkiraan . Pilihan kriteria informasi tergantung pada parameter yang Anda berikan ke fungsi.

Untuk model linier, memilih model dengan AIC terkecil dapat setara dengan validasi silang keluar-keluar-satu.

Anda juga harus memastikan bahwa Anda memiliki cukup data, setidaknya empat tahun.

Beberapa pemeriksaan penting:

  1. Apakah modelnya masuk akal? Misalnya, jika Anda memiliki penjualan ritel bulanan, Anda mungkin akan mengharapkan model musiman sesuai.
  2. Seberapa baik perkiraan dari sampel?

Jawaban eksplisit untuk komentar Firebug di bawah ini: Saat data Anda mendukungnya.

kekuasaan
sumber
3
Jawaban ini sama sekali tidak menjawab pertanyaan:"My question is, when would one of either of these two situations occur? "
Firebug
1
"Jawaban eksplisit untuk komentar Firebug di bawah ini: Ketika data Anda mendukungnya." Saya setuju dengan @ Firebug - ini bukan jawaban untuk pertanyaan dan jelas bukan contoh yang solid untuk membedakan keduanya ...
Thomas
xkcd.com/386
power