Saya telah menemukan dua definisi dalam literatur untuk waktu autokorelasi dari serangkaian waktu yang stasioner:
di mana adalah autokorelasi pada lagk.
Salah satu penerapan waktu autokorelasi adalah menemukan "ukuran sampel efektif": jika Anda memiliki pengamatan seri waktu, dan Anda tahu waktu autokorelasi τ , maka Anda dapat berpura-pura memiliki
sampel independen bukannya berkorelasi untuk tujuan menemukan rata-rata. Memperkirakan τ dari data adalah non-sepele, tetapi ada beberapa cara untuk melakukannya (lihat Thompson 2010 ).
Definisi tanpa nilai absolut, , tampaknya lebih umum dalam literatur; tetapi ia mengakui kemungkinan τ a < 1 . Menggunakan paket R dan "coda":
require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000) # white noise
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000) # AR(1)
effectiveSize(ts.uncorr) # Sanity check
# result should be close to 10000
effectiveSize(ts.corr)
# result is in the neighborhood of 30000... ???
Fungsi "effectiveSize" dalam "coda" menggunakan definisi waktu autokorelasi yang setara dengan , di atas. Ada beberapa paket R lain di luar sana yang menghitung ukuran sampel efektif atau waktu autokorelasi, dan semua yang saya coba memberikan hasil yang konsisten dengan ini: bahwa proses AR (1) dengan koefisien AR negatif memiliki sampel lebih efektif daripada yang berkorelasi seri waktu. Ini sepertinya aneh.
Jelas, ini tidak akan pernah terjadi di definisi waktu autokorelasi .
Apa definisi waktu autokorelasi yang benar? Apakah ada yang salah dengan pemahaman saya tentang ukuran sampel yang efektif? Hasil ditunjukkan di atas sepertinya salah ... apa yang terjadi?
sumber
Jawaban:
sumber
Lihat http://arxiv.org/pdf/1403.5536v1.pdf
dan
https://cran.r-project.org/web/packages/mcmcse/mcmcse.pdf
untuk ukuran sampel yang efektif. Saya pikir formulasi alternatif menggunakan rasio varians sampel dan varians rantai Markov asimptotik melalui batch rata-rata adalah penduga yang lebih tepat.
sumber