Proses AR (1) dengan kesalahan pengukuran heteroskedastik

13

1. Masalahnya

Saya memiliki beberapa pengukuran variabel , di mana , di mana saya memiliki distribusi diperoleh melalui MCMC, yang untuk kesederhanaan saya akan menganggapnya sebagai gaussian rata-rata dan varians \ sigma_t ^ 2 .ytt=1,2,..,nfyt(yt)μtσt2

Saya punya model fisik untuk pengamatan itu, katakanlah g(t) , tetapi residual rt=μtg(t) tampaknya berkorelasi; khususnya, saya memiliki alasan fisik untuk berpikir bahwa proses AR(1) akan cukup untuk memperhitungkan korelasinya, dan saya berencana untuk mendapatkan koefisien kecocokan melalui MCMC, yang saya perlukan kemungkinannya . Saya pikir solusinya agak sederhana, tetapi saya tidak begitu yakin (sepertinya sangat sederhana, bahwa saya pikir saya kehilangan sesuatu).

2. Menurunkan kemungkinan

Proses AR (1) nol-rata AR(1)dapat ditulis sebagai:

Xt=ϕXt1+εt,   (1)
mana saya akan mengasumsikan εtN(0,σw2) . Parameter yang diestimasi adalah, oleh karena itu, θ={ϕ,σw2} (dalam kasus saya, saya juga harus menambahkan parameter model g(t) , tetapi bukan itu masalahnya). Apa yang saya amati, bagaimanapun, adalah variabel
Rt=Xt+ηt,   (2)
mana saya mengasumsikan ηtN(0,σt2) , dan σt2 diketahui (the kesalahan pengukuran). Karena Xt adalah proses gaussian, Rt juga. Secara khusus, saya tahu itu
X1N(0,σw2/[1ϕ2]),
oleh karena itu,
R1N(0,σw2/[1ϕ2]+σt2).
Tantangan berikutnya adalah mendapatkan Rt|Rt1 untuk t1 . Untuk mendapatkan distribusi variabel acak ini, perhatikan bahwa, menggunakan persamaan. (2) Saya dapat menulis
Xt1=Rt1ηt1.   (3)
Menggunakan persamaan. (2) , dan menggunakan definisi persamaan. (1) , saya bisa menulis,
Rt=Xt+ηt=ϕXt1+εt+ηt.
Menggunakan persamaan (3) dalam ungkapan terakhir ini, maka, saya memperoleh,
Rt=ϕ(Rt1ηt1)+εt+ηt,
dengan demikian,
Rt|Rt1=ϕ(rt1ηt1)+εt+ηt,
dan, karenanya,
Rt|Rt1N(ϕrt1,σw2+σt2ϕ2σt12).
Akhirnya, saya dapat menulis fungsi kemungkinan sebagai
L(θ)=fR1(R1=r1)t=2nfRt|Rt1(Rt=rt|Rt1=rt1),
mana f() adalah distribusi dari variabel yang baru saja saya definisikan, .ie, mendefinisikan σ2=σw2/[1ϕ2]+σt2,
fR1(R1=r1)=12πσ2exp(r122σ2),
dan mendefinisikan σ2(t)=σw2+σt2ϕ2σt12 ,
fRt|Rt1(Rt=rt|Rt1=rt1)=12πσ2(t)exp((rtϕrt1)22σ2(t))

3. Pertanyaan

  1. Apakah derivasi saya baik-baik saja? Saya tidak punya sumber daya untuk membandingkan selain simulasi (yang tampaknya setuju), dan saya bukan ahli statistik!
  2. Apakah ada derivasi hal-hal semacam ini dalam literatur untuk proses atau proses ? MA(1)ARMA(1,1)Sebuah studi untuk proses secara umum yang dapat dikhususkan untuk kasus ini akan menyenangkan.ARMA(p,q)
Néstor
sumber
Saya sebenarnya tidak punya solusi untuk Anda. Tapi, saya pikir ini adalah semacam masalah variabel error-in. Saya telah melihat hal ini dalam Teori Makroekonomi oleh Thomas Sergent (buku 1980-an). Anda mungkin ingin melihatnya.
Metrik
Terima kasih atas masukannya, @ Metrik. Saya akan memeriksa buku itu!
Néstor

Jawaban:

1
  1. Anda berada di jalur yang benar, tetapi Anda telah membuat kesalahan dalam menurunkan distribusi diberikan : mean kondisional bukan . Ini , di mana adalah estimasi terbaik Anda dari dari periode sebelumnya. Nilai termasuk informasi dari pengamatan sebelumnya serta . (Untuk melihat ini, pertimbangkan situasi di mana dan dapat diabaikan, sehingga Anda secara efektif memperkirakan mean tetap. Setelah banyak pengamatan, ketidakpastian Anda tentang akan jauh lebih kecil daripadaRtRt1ϕrt1ϕx^t1x^t1Xx^t1rt1σwϕXση .) ini dapat membingungkan pada awalnya, karena Anda mengamati dan tidak . Itu hanya berarti bahwa Anda berurusan dengan model ruang-negara .RX

  2. Ya, ada kerangka kerja yang sangat umum untuk menggunakan model linear-Gaussian dengan pengamatan bising, disebut filter Kalman . Ini berlaku untuk apa pun dengan struktur ARIMA dan banyak lagi model juga. bervariasi waktu adalah OK untuk filter Kalman, asalkan itu tidak stokastik. Model dengan, misalnya, volatilitas stokastik memerlukan metode yang lebih umum. Untuk melihat bagaimana filter Kalman diturunkan, coba Durbin-Koopman atau bab 3 Harvey . Dalam notasi Harvey, model Anda memiliki , , , , dan .σηZ=1d=c=0Ht=ση,t2T=ϕR=1Q=σw2

Jamie Hall
sumber
Hai Jamie, terima kasih atas masukan Anda. Beberapa komentar: 1. Saya tidak yakin tentang itu. Sebenarnya, itu adalah upaya pertama saya sebagai solusi tetapi intuisi dan simulasi saya tidak setuju dengan itu. Masalahnya adalah saya sebenarnya tidak mengamati , saya amati ; ditambah, dapatkah Anda membuktikan (secara hitung) bahwa mean bersyarat dari variabel acak (perhatikan bahwa itu bukan ) sebenarnya ? 2. Bisakah Anda menguraikan aplikasi filter Kalman untuk masalah khusus ini? XtRtRt|Rt1=rt1Rt|Xt1=xt1ϕx^t1
Néstor
Hai Nestor, saya sudah mengedit jawaban untuk menanggapi komentar Anda. Semoga itu bisa membantu.
Jamie Hall
Hai Jamie: tentang poin kedua, tidak apa-apa, terima kasih :-)! Namun, saya masih tidak dapat melihat poin pertama Anda. Bisakah Anda mengarahkan saya ke derivasi formal? Secara khusus, saya ingin tahu bagian mana dari alasan saya yang salah (dan mengapa)!
Néstor
Anda melewatkan langkah: distribusi diberikan . Ini , di mana adalah varians yang Anda hitung di langkah pertama, dan adalah dua kali rata-rata harmonik dari dan . (Ini seperti pembaruan Bayesian dengan dua pdf Gaussian.) Persamaan Anda (3) secara resmi benar, tetapi Anda membuang informasi dengan menggunakan itu alih-alih . X1R1N(σx,12(σx,12+ση,12)r1,σx,22)σx,12σx,22σx,12ση,12p(Xt1|R1:t1)
Jamie Hall
-1

Jujur, Anda harus kode ini dalam BUG atau STAN dan tidak khawatir tentang hal itu dari sana. Kecuali jika ini adalah pertanyaan teoretis.

DavidShor
sumber
2
(-1) Untuk tanggapan ini; ini jelas pertanyaan teoretis ;-). Pertimbangkan untuk meningkatkan mengapa Anda pikir saya harus menulis kode dalam BUG atau STAN dan apa hubungannya dengan pertanyaan awal?
Néstor