Istilah kesalahan model rata-rata bergerak

17

Ini adalah pertanyaan mendasar pada model Box-Jenkins MA. Seperti yang saya pahami, model MA pada dasarnya adalah regresi linier dari nilai time-series $Y$ terhadap istilah kesalahan sebelumnya . Yaitu, pengamatan pertama mundur terhadap nilai sebelumnya dan kemudian satu atau lebih nilai digunakan sebagai istilah kesalahan untuk MA model. $e_t,..., e_{t-n}$ $Y$ $Y_{t-1}, ..., Y_{t-n}$ $Y - \hat{Y}$

Tetapi bagaimana istilah kesalahan dihitung dalam model ARIMA (0, 0, 2)? Jika model MA digunakan tanpa bagian autoregresif dan karenanya tidak ada nilai estimasi, bagaimana saya bisa memiliki istilah kesalahan?

regression time-series arima box-jenkins Robert Kubrick
sumber

1

Tidak, saya pikir Anda membingungkan definisi model MA (n), di mana regresi hanya dalam hal 's, dengan estimasi, di mana

diperkirakan dari data .

e_{t - i}

$e_{t-i}$

e_{t - i}

$e_{t-i}$

Xi'an

1

Masalah utama dalam pertanyaan Anda adalah bahwa Anda mengatakan bahwa model MA pada dasarnya adalah regresi linier. Ini sama sekali tidak benar, karena kami tidak mengamati istilah kesalahan.

mpiktas

Saya pikir istilah error adalah benar-benar

Y_{t} - \hat{Y_{t}}

$Y_t - \hat{Y_t}$ , di mana

\hat{Y}

$\hat{Y}$ adalah

E (Y | Y_{t, . . ., t - n})

$E(Y|Y_{t,...,t-n})$ atau hanya

Y_{t} - Y_{t - 1}

$Y_t - Y_{t-1}$ . Itulah sebabnya estimasi parameter model MA berasal dari pola berulang dalam fungsi autokorelasi parsial

Y

$Y$ , yaitu perilaku residu. Estimasi parameter AR sebagai gantinya, didasarkan pada pola berulang acf (Y).

Robert Kubrick

20

Estimasi Model MA:

Mari kita asumsikan seri dengan 100 poin waktu, dan katakan ini ditandai dengan model MA (1) tanpa intersep. Kemudian model diberikan oleh

y_{t} = ε_{t} - θ ε_{t - 1}, t = 1, 2, \dots, 100 (1)

$y_t=\varepsilon_t-\theta\varepsilon_{t-1},\quad t=1,2,\cdots,100\quad (1)$

Istilah kesalahan di sini tidak diamati. Jadi untuk mendapatkan ini, Box et al. Analisis Rangkaian Waktu: Perkiraan dan Kontrol (Edisi 3) , halaman 228 , menyarankan bahwa istilah kesalahan dihitung secara rekursif oleh,

ε_{t} = y_{t} + θ ε_{t - 1}

$\varepsilon_t=y_t+\theta\varepsilon_{t-1}$

Jadi istilah kesalahan untuk adalah, Sekarang kita tidak dapat menghitung ini tanpa mengetahui nilai . Jadi untuk mendapatkan ini, kita perlu menghitung estimasi awal atau awal model, lihat Box et al. dari buku tersebut, Bagian 6.3.2 halaman 202 menyatakan bahwa, $t=1$

ε_{1} = y_{1} + θ ε_{0}

$\varepsilon_{1}=y_{1}+\theta\varepsilon_{0}$

θ

$\theta$

Telah ditunjukkan bahwa autokorelasi pertama dari proses MA ( ) adalah nol dan dapat ditulis dalam hal parameter model sebagai Ungkapan di atas untuk dalam istilah , memasok persamaan dalam tidak diketahui. Estimasi awal dari dapat diperoleh dengan mensubstitusi estimasi untuk dalam persamaan di atas $q$ $q$
$ρ_{k} = \frac{- θ_{k} + θ_{1} θ_{k + 1} + θ_{2} θ_{k + 2} + \dots + θ_{q - k} θ_{q}}{1 + θ_{1}^{2} + θ_{2}^{2} + \dots + θ_{q}^{2}} k = 1, 2, \dots, q$ $\rho_k=\displaystyle\frac{-\theta_{k}+\theta_1\theta_{k+1}+\theta_2\theta_{k+2}+\cdots+\theta_{q-k}\theta_q}{1+\theta_1^2+\theta_2^2+\cdots+\theta_q^2}\quad k=1,2,\cdots, q$ $\rho_1,\rho_2\cdots,\rho_q$ $\theta_1,\theta_2,\cdots,\theta_q$ $q$ $q$ $\theta$ $r_k$ $\rho_k$

Perhatikan bahwa adalah estimasi autokorelasi. Ada diskusi lebih lanjut di Bagian 6.3 - Perkiraan Awal untuk Parameter , silakan baca itu. Sekarang, dengan asumsi kita memperoleh estimasi awal . Kemudian, Sekarang, masalah lain adalah kita tidak memiliki nilai untuk karena mulai dari 1, jadi kita tidak dapat menghitung . Untungnya, ada dua metode yang dua dapatkan ini, $r_k$ $\theta=0.5$

ε_{1} = y_{1} + 0.5 ε_{0}

$\varepsilon_{1}=y_{1}+0.5\varepsilon_{0}$

ε_{0}

$\varepsilon_0$

t

$t$

ε_{1}

$\varepsilon_1$

Kemungkinan Bersyarat
Kemungkinan Tanpa Syarat

Menurut Box et al. Bagian 7.1.3 halaman 227 , nilai dapat disubstitusikan menjadi nol sebagai perkiraan jika sedang atau besar, metode ini adalah Conditional Likelihood. Jika tidak, Unconditional Likelihood digunakan, di mana nilai diperoleh dengan prakiraan kembali, Box et al. merekomendasikan metode ini. Baca lebih lanjut tentang prakiraan kembali di Bagian 7.1.4 halaman 231 . $\varepsilon_0$ $n$ $\varepsilon_0$

Setelah mendapatkan estimasi awal dan nilai , maka akhirnya kita dapat melanjutkan dengan perhitungan rekursif dari istilah kesalahan. Kemudian tahap terakhir adalah memperkirakan parameter model , ingat ini bukan perkiraan awal lagi. $\varepsilon_0$ $(1)$

Dalam mengestimasi parameter , saya menggunakan prosedur Estimasi Nonlinear, khususnya algoritma Levenberg-Marquardt, karena model MA adalah nonlinear pada parameternya. $\theta$

Secara keseluruhan, saya akan sangat menyarankan Anda untuk membaca Box et al. Analisis Rangkaian Waktu: Peramalan dan Kontrol (Edisi ke-3) .

Al-Ahmadgaid Asaad
sumber

Bisakah Anda menjelaskan apa itu ?

r_{k}

$r_k$

Piyush Divyanakar

4

Model Gaussian MA (q) didefinisikan (tidak hanya oleh Box dan Jenkins!) Sebagai sehingga model MA (q) adalah model kesalahan "murni", tingkat menentukan seberapa jauh korelasinya kembali.

Y_{t} = - \sum_{i = 1}^{q} ϑ_{i} e_{t - i} + σ e_{t}, e_{t} \overset{iid}{\sim} N (0, 1)

$Y_t = -\sum_{i=1}^q \vartheta_i e_{t-i} + \sigma e_t,\quad e_t\stackrel{\text{iid}}{\sim} \mathcal{N}(0,1)$

q

$q$

Xi'an
sumber

1

Aku masih tidak jelas di mana

berasal dari. Apakah

variabel acak? Saya tidak berpikir begitu, kalau tidak mengapa repot mencari korelasi

?

e_{t}

$e_t$

e_{t}

$e_t$

q

$q$

Robert Kubrick

1

Mengapa ada minus dalam rumus Anda? Biasanya minus adalah untuk model AR. Secara matematis bukan masalah, saya hanya ingin tahu, karena saya belum pernah melihat minus dalam model MA.

mpiktas

3

@ RobertTubrick, apakah Anda mengetahui teorema dekomposisi Wold ? Setiap proses stasioner memiliki proses inovasi yang sesuai, yaitu dari mana istilah

datang.

e_{t}

$e_t$

mpiktas

1

@mpiktas Terima kasih, yang memberikan beberapa latar belakang pada istilah kesalahan, tapi saya masih belum jelas dari mana proses inovasi berasal, untuk inovasi yang ada harus ada ramalan di suatu tempat ( en.wikipedia.org/wiki/Innovation_ ( signal_processing) ). Apakah ramalan

optimal hanya

, itu adalah rata-rata dari seri?

Y

$Y$

E (Y)

$E(Y)$

Robert Kubrick

1

$Y$ $Y_{t−1},...,Y_{t−n}$ $Y−\hat{Y}$ $Y$ $e_{t-1}$ $e_{t−2}$ $e_t$ $\theta_1$ $e_{t-1}$ $\theta_2$ $e_{t-2}$ $e_t$ $\theta_1$ $\theta_2$ $\theta_1$ $\theta_2$

IrishStat
sumber

Y

$Y$

Y

$Y$

1

2 prediktor adalah kelambanan dari istilah kesalahan. Karena ini tidak diketahui secara apriori karena kita tidak tahu istilah kesalahan sebelum kita mulai adalah mengapa ini harus diperlakukan dengan estimasi non-linear. Kebingungan yang Anda miliki adalah bahwa model yang terbatas di masa lalu (yaitu AR MODEL) berpotensi tak terbatas dalam kesalahan DAN model yang terbatas dalam kesalahan (yaitu MA MODEL) berpotensi tak terbatas di masa lalu Y. Alasan seseorang memilih MODEL AR versus MODEL MA adalah untuk kekikiran. Terkadang kami membuat MODEL ARMA yang memadukan sejarah Y dan sejarah kesalahan.

IrishStat

1

Y

$Y$

e_{t - n}

$e_{t-n}$

1

Lihat posting saya di sini untuk penjelasan tentang bagaimana memahami istilah gangguan dalam seri MA.

Anda membutuhkan teknik estimasi yang berbeda untuk memperkirakannya. Ini karena Anda tidak dapat terlebih dahulu mendapatkan residu dari regresi linier dan kemudian memasukkan nilai residu yang tertinggal sebagai variabel penjelas karena proses MA menggunakan residu dari regresi saat ini. Dalam contoh Anda, Anda membuat dua persamaan regresi dan menggunakan residu dari satu ke yang lain. Ini bukan proses MA. Itu tidak dapat diperkirakan dengan OLS.

JoeDanger
sumber

Istilah kesalahan model rata-rata bergerak

Jawaban: