Definisi waktu autokorelasi (untuk ukuran sampel yang efektif)

23

Saya telah menemukan dua definisi dalam literatur untuk waktu autokorelasi dari serangkaian waktu yang stasioner:

τa=1+2k=1ρkversusτb=1+2k=1|ρk|

di mana adalah autokorelasi pada lagk. ρk=Cov[Xt,Xt+h]Var[Xt]k

Salah satu penerapan waktu autokorelasi adalah menemukan "ukuran sampel efektif": jika Anda memiliki pengamatan seri waktu, dan Anda tahu waktu autokorelasi τ , maka Anda dapat berpura-pura memilikinτ

neff=nτ

sampel independen bukannya berkorelasi untuk tujuan menemukan rata-rata. Memperkirakan τ dari data adalah non-sepele, tetapi ada beberapa cara untuk melakukannya (lihat Thompson 2010 ).nτ

Definisi tanpa nilai absolut, , tampaknya lebih umum dalam literatur; tetapi ia mengakui kemungkinan τ a < 1 . Menggunakan paket R dan "coda":τaτa<1

require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000)         # white noise 
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000)    # AR(1)
effectiveSize(ts.uncorr)                             # Sanity check
    # result should be close to 10000
effectiveSize(ts.corr)
    # result is in the neighborhood of 30000... ???

Fungsi "effectiveSize" dalam "coda" menggunakan definisi waktu autokorelasi yang setara dengan , di atas. Ada beberapa paket R lain di luar sana yang menghitung ukuran sampel efektif atau waktu autokorelasi, dan semua yang saya coba memberikan hasil yang konsisten dengan ini: bahwa proses AR (1) dengan koefisien AR negatif memilikiτa sampel lebih efektif daripada yang berkorelasi seri waktu. Ini sepertinya aneh.

Jelas, ini tidak akan pernah terjadi di τb definisi waktu autokorelasi .

Apa definisi waktu autokorelasi yang benar? Apakah ada yang salah dengan pemahaman saya tentang ukuran sampel yang efektif? Hasil ditunjukkan di atas sepertinya salah ... apa yang terjadi?neff>n

andrewtinka
sumber
Hanya untuk memastikan saya tidak disalahpahami tidak yang seharusnya bukan h ? Cov(Xt,Xt+k)h
sachinruk
2
Saya tertarik pada definisi kedua, yaitu, . Bisakah Anda memberikan literatur di tempat Anda menemukannya? τb
Harry

Jawaban:

17

X1,X2,μ

μ^=1nk=1nXk
μn1μ^
1n2k,l=1ncov(Xk,Xl)=1n(1+2(n1nρ1+n2nρ2++1nρn1))τan.
nneff=n/τaneff1neffneff=n/τa

n1neff>n

NRH
sumber
2
Bagi siapa saja yang ingin tahu lebih banyak tentang penggunaan korelasi negatif dalam simulasi Monte Carlo, cobalah googling "antitesis variates". Info lebih lanjut dalam catatan kursus di sini atau di sini .
andrewtinka
1

Lihat http://arxiv.org/pdf/1403.5536v1.pdf

dan

https://cran.r-project.org/web/packages/mcmcse/mcmcse.pdf

untuk ukuran sampel yang efektif. Saya pikir formulasi alternatif menggunakan rasio varians sampel dan varians rantai Markov asimptotik melalui batch rata-rata adalah penduga yang lebih tepat.

sobat subhadip
sumber
4
Bisakah Anda memperluas konten di tautan tersebut? Sebagaimana adanya, ini terlalu pendek untuk dijawab oleh standar kita!
kjetil b halvorsen