Pertanyaan tentang fungsi sampel autokovarian

10

Saya membaca buku analisis deret waktu dan rumus untuk sampel autocovariance didefinisikan dalam buku ini sebagai:

γ^(h)=n1t=1nh(xt+hx¯)(xtx¯)

denganuntuk . adalah mean.γ^(h)=γ^(h)h=0,1,...,n1x¯

Bisakah seseorang menjelaskan secara intuitif mengapa kita membagi jumlah dengan dan bukan dengan ? Buku ini menjelaskan bahwa ini adalah karena rumus di atas adalah fungsi pasti non-negatif dan jadi membaginya dengan lebih disukai, tetapi ini tidak jelas bagi saya. Bisakah seseorang membuktikan ini atau menunjukkan contoh atau sesuatu?nnhn

Bagi saya hal yang intuitif pada awalnya adalah membagi dengan . Apakah ini penaksir autokovarians yang bias atau bias?nh

jjepsuomi
sumber
1
Jika deret waktu Anda persis dengan semua lainnya , atau tidak diketahui, maka jumlah tersebut harus berhenti pada ketika terjadi di jumlah: istilah berikutnya (untuk ) yang akan dimasukkan dalam jumlah akan memiliki di dalamnya, dan bukan bagian dari sampel. x1,x2,,xnxii<1i>nt=nhxt+h=xnt=nh+1xnh+1+h=xn+1xn+1
Dilip Sarwate
@Dilip Saya tidak berpikir itu masalahnya: pertanyaannya adalah apakah akan membagi dengan atau dalam definisi . n - h γnnhγ^
whuber

Jawaban:

14

t1,t2,...,tkXt1,Xt2,...,Xtk( γ (ti-tj),1i,jk)γ^ digunakan untuk membuat matriks kovarian: diberikan "times" , ia memperkirakan bahwa kovarians dari vektor acak (diperoleh dari bidang acak pada waktu itu) adalah matriks . Untuk banyak masalah, seperti prediksi, sangat penting bahwa semua matriks tersebut harus nonsingular. Sebagai matriks kovarian putatif, jelas mereka tidak dapat memiliki nilai eigen negatif, di mana semuanya harus pasti-positif.t1,t2,,tkXt1,Xt2,,Xtk(γ^(titj),1i,jk)

Situasi paling sederhana di mana perbedaan antara dua formula

γ^(h)=n1t=1nh(xt+hx¯)(xtx¯)

dan

γ^0(h)=(nh)1t=1nh(xt+hx¯)(xtx¯)

muncul adalah ketika memiliki panjang ; katakan, . Untuk dan mudah untuk dihitungx2x=(0,1)t1=tt2=t+1

γ^0=(14141414),

yang tunggal, sedangkan

γ^=(14181814)

yang memiliki nilai eigen dan , di mana itu bernilai positif pasti.3/81/8

Fenomena serupa terjadi untuk , di mana pasti-positif tetapi ketika diterapkan pada waktu , katakanlah - merosot menjadi matriks peringkat (entrinya berganti-ganti antara dan ).x=(0,1,0,1)γ^γ^0ti=(1,2,3,4)11/41/4

(Ada pola di sini: masalah muncul untuk setiap bentuk .)x(a,b,a,b,,a,b)

Dalam sebagian besar aplikasi, seri pengamatan sangat panjang sehingga untuk sebagian besar menarik - yang jauh lebih kecil dari - perbedaan antara dan tidak ada konsekuensinya. Jadi dalam praktiknya perbedaan itu bukan masalah besar dan secara teoritis kebutuhan akan kepastian positif sangat mengesampingkan setiap keinginan yang mungkin untuk perkiraan yang tidak bias.xthnn1(nh)1

whuber
sumber
1
Saya pikir ini penting untuk dicatat bahwa kedua penduga adalah penduga yang bias, bahkan jika Anda membaginya dengan nh.
Berlari
@Bisa Meskipun Anda benar bahwa penaksir ini bias, saya tidak setuju bahwa ini adalah masalah penting: seperti yang disebutkan dalam paragraf terakhir, sejumlah kecil bias adalah yang paling sedikit dari kekhawatiran siapa pun. Estimator yang tidak bias, menggunakan , hampir tidak berbeda dari atau . (nh1)1γ^γ^0
whuber
2
+1 sangat bagus. Mungkin berguna untuk menambahkan poin bahwa , sementara , jadi ketika dekat dengan , estimator dapat tidak menentu, sementara akan memiliki fluktuasi sampel seragam yang kecil . Lihat misalnya Priestly (1981) "Analisis Spektral dan Rangkaian Waktu" hal324 untuk diskusi terperinci tentang hal iniV γ ( h ) = O ( 1 / n ) h n γ 0 ( h ) γ ( h ) hVγ^0(h)=O(1/(nh))Vγ^(h)=O(1/n)hnγ^0(h)γ^(h)h
Colin T Bowers