Istilah kesalahan model rata-rata bergerak

17

Ini adalah pertanyaan mendasar pada model Box-Jenkins MA. Seperti yang saya pahami, model MA pada dasarnya adalah regresi linier dari nilai time-series Y terhadap istilah kesalahan sebelumnya . Yaitu, pengamatan pertama mundur terhadap nilai sebelumnya dan kemudian satu atau lebih nilai digunakan sebagai istilah kesalahan untuk MA model. Y Y t - 1 , . . . , Y t - n Y - Yet,...,etnYYt1,...,YtnYY^

Tetapi bagaimana istilah kesalahan dihitung dalam model ARIMA (0, 0, 2)? Jika model MA digunakan tanpa bagian autoregresif dan karenanya tidak ada nilai estimasi, bagaimana saya bisa memiliki istilah kesalahan?

Robert Kubrick
sumber
1
Tidak, saya pikir Anda membingungkan definisi model MA (n), di mana regresi hanya dalam hal 's, dengan estimasi, di mana e_ {ti} diperkirakan dari data . e t - ietieti
Xi'an
1
Masalah utama dalam pertanyaan Anda adalah bahwa Anda mengatakan bahwa model MA pada dasarnya adalah regresi linier. Ini sama sekali tidak benar, karena kami tidak mengamati istilah kesalahan.
mpiktas
Saya pikir istilah error adalah benar-benar YtYt^ , di mana Y^ adalah E(Y|Yt,...,tn) atau hanya YtYt1 . Itulah sebabnya estimasi parameter model MA berasal dari pola berulang dalam fungsi autokorelasi parsial Y , yaitu perilaku residu. Estimasi parameter AR sebagai gantinya, didasarkan pada pola berulang acf (Y).
Robert Kubrick

Jawaban:

20

Estimasi Model MA:

Mari kita asumsikan seri dengan 100 poin waktu, dan katakan ini ditandai dengan model MA (1) tanpa intersep. Kemudian model diberikan oleh

yt=εtθεt1,t=1,2,,100(1)

Istilah kesalahan di sini tidak diamati. Jadi untuk mendapatkan ini, Box et al. Analisis Rangkaian Waktu: Perkiraan dan Kontrol (Edisi 3) , halaman 228 , menyarankan bahwa istilah kesalahan dihitung secara rekursif oleh,

εt=yt+θεt1

Jadi istilah kesalahan untuk adalah, Sekarang kita tidak dapat menghitung ini tanpa mengetahui nilai . Jadi untuk mendapatkan ini, kita perlu menghitung estimasi awal atau awal model, lihat Box et al. dari buku tersebut, Bagian 6.3.2 halaman 202 menyatakan bahwa,ε 1 = y 1 + θ ε 0 θt=1

ε1=y1+θε0
θ

Telah ditunjukkan bahwa autokorelasi pertama dari proses MA ( ) adalah nol dan dapat ditulis dalam hal parameter model sebagai Ungkapan di atas untuk dalam istilah , memasok persamaan dalam tidak diketahui. Estimasi awal dari dapat diperoleh dengan mensubstitusi estimasi untuk dalam persamaan di atasq ρ k = - θ k + θ 1 θ k + 1 + θ 2 θ k + 2 + + θ q - k θ qqqρ 1 , ρ 2, ρ q θ 1 , θ

ρk=θk+θ1θk+1+θ2θk+2++θqkθq1+θ12+θ22++θq2k=1,2,,q
ρ1,ρ2,ρq q q θ r k ρ kθ1,θ2,,θqqqθrkρk

Perhatikan bahwa adalah estimasi autokorelasi. Ada diskusi lebih lanjut di Bagian 6.3 - Perkiraan Awal untuk Parameter , silakan baca itu. Sekarang, dengan asumsi kita memperoleh estimasi awal . Kemudian, Sekarang, masalah lain adalah kita tidak memiliki nilai untuk karena mulai dari 1, jadi kita tidak dapat menghitung . Untungnya, ada dua metode yang dua dapatkan ini,rkε 1 = y 1 + 0,5 ε 0 ε 0 t ε 1θ=0.5

ε1=y1+0.5ε0
ε0tε1
  1. Kemungkinan Bersyarat
  2. Kemungkinan Tanpa Syarat

Menurut Box et al. Bagian 7.1.3 halaman 227 , nilai dapat disubstitusikan menjadi nol sebagai perkiraan jika sedang atau besar, metode ini adalah Conditional Likelihood. Jika tidak, Unconditional Likelihood digunakan, di mana nilai diperoleh dengan prakiraan kembali, Box et al. merekomendasikan metode ini. Baca lebih lanjut tentang prakiraan kembali di Bagian 7.1.4 halaman 231 . n ε 0ε0nε0

Setelah mendapatkan estimasi awal dan nilai , maka akhirnya kita dapat melanjutkan dengan perhitungan rekursif dari istilah kesalahan. Kemudian tahap terakhir adalah memperkirakan parameter model , ingat ini bukan perkiraan awal lagi. ( 1 )ε0(1)

Dalam mengestimasi parameter , saya menggunakan prosedur Estimasi Nonlinear, khususnya algoritma Levenberg-Marquardt, karena model MA adalah nonlinear pada parameternya.θ

Secara keseluruhan, saya akan sangat menyarankan Anda untuk membaca Box et al. Analisis Rangkaian Waktu: Peramalan dan Kontrol (Edisi ke-3) .

Al-Ahmadgaid Asaad
sumber
Bisakah Anda menjelaskan apa itu ? rk
Piyush Divyanakar
4

Model Gaussian MA (q) didefinisikan (tidak hanya oleh Box dan Jenkins!) Sebagai sehingga model MA (q) adalah model kesalahan "murni", tingkat menentukan seberapa jauh korelasinya kembali.

Yt=i=1qϑieti+σet,etiidN(0,1)
q
Xi'an
sumber
1
Aku masih tidak jelas di mana berasal dari. Apakah e t variabel acak? Saya tidak berpikir begitu, kalau tidak mengapa repot mencari korelasi q ? etetq
Robert Kubrick
1
Mengapa ada minus dalam rumus Anda? Biasanya minus adalah untuk model AR. Secara matematis bukan masalah, saya hanya ingin tahu, karena saya belum pernah melihat minus dalam model MA.
mpiktas
3
@ RobertTubrick, apakah Anda mengetahui teorema dekomposisi Wold ? Setiap proses stasioner memiliki proses inovasi yang sesuai, yaitu dari mana istilah datang. et
mpiktas
1
@mpiktas Terima kasih, yang memberikan beberapa latar belakang pada istilah kesalahan, tapi saya masih belum jelas dari mana proses inovasi berasal, untuk inovasi yang ada harus ada ramalan di suatu tempat ( en.wikipedia.org/wiki/Innovation_ ( signal_processing) ). Apakah ramalan optimal hanya E ( Y ) , itu adalah rata-rata dari seri? YE(Y)
Robert Kubrick
1

YYt1,...,YtnYY^Yet1et2etθ1et1θ2et2etθ1θ2θ1θ2

IrishStat
sumber
YY
1
2 prediktor adalah kelambanan dari istilah kesalahan. Karena ini tidak diketahui secara apriori karena kita tidak tahu istilah kesalahan sebelum kita mulai adalah mengapa ini harus diperlakukan dengan estimasi non-linear. Kebingungan yang Anda miliki adalah bahwa model yang terbatas di masa lalu (yaitu AR MODEL) berpotensi tak terbatas dalam kesalahan DAN model yang terbatas dalam kesalahan (yaitu MA MODEL) berpotensi tak terbatas di masa lalu Y. Alasan seseorang memilih MODEL AR versus MODEL MA adalah untuk kekikiran. Terkadang kami membuat MODEL ARMA yang memadukan sejarah Y dan sejarah kesalahan.
IrishStat
1
Yetn
1

Lihat posting saya di sini untuk penjelasan tentang bagaimana memahami istilah gangguan dalam seri MA.

Anda membutuhkan teknik estimasi yang berbeda untuk memperkirakannya. Ini karena Anda tidak dapat terlebih dahulu mendapatkan residu dari regresi linier dan kemudian memasukkan nilai residu yang tertinggal sebagai variabel penjelas karena proses MA menggunakan residu dari regresi saat ini. Dalam contoh Anda, Anda membuat dua persamaan regresi dan menggunakan residu dari satu ke yang lain. Ini bukan proses MA. Itu tidak dapat diperkirakan dengan OLS.

JoeDanger
sumber