Estimasi berjalan acak dengan AR (1)

10

Ketika saya memperkirakan jalan acak dengan AR (1), koefisiennya sangat dekat dengan 1 tetapi selalu kurang.

Apa alasan matematika bahwa koefisiennya tidak lebih besar dari satu?

Marco
sumber
Saya mencoba dengan Matlab toolbox dan juga dengan skrip saya pada arima (di mana koefisien dibatasi pada [-10,10] dan hasilnya sama). Saya mencoba dengan OLS sederhana dan hasilnya sama.
Marco
Perkiraannya bias ke bawah, kita harus membaca makalah Dickey dan Fuller.
Marco

Jawaban:

12

Kami memperkirakan dengan OLS model

xt=ρxt1+ut,E(ut{xt1,xt2,...})=0,x0=0

Untuk sampel ukuran T, estimatornya adalah

ρ^=t=1Txtxt1t=1Txt12=ρ+t=1Tutxt1t=1Txt12

ρ=1

xt=xt1+utxt=i=1tui

ρ^168ρ^<1

masukkan deskripsi gambar di sini

Mean:0.0017773Median:0.00085984Minimum: 0.042875Maximum: 0.0052173Standard deviation: 0.0031625Skewness: 2.2568Ex. kurtosis: 8.3017

Ini kadang-kadang disebut distribusi "Dickey-Fuller", karena ini adalah dasar untuk nilai-nilai kritis yang digunakan untuk melakukan tes Unit-Root dengan nama yang sama.

Saya tidak ingat melihat upaya untuk memberikan intuisi untuk bentuk distribusi sampling. Kami melihat distribusi sampling dari variabel acak

ρ^1=(t=1Tutxt1)(1t=1Txt12)

utρ^1ρ^1

T=5

Jika kami menjumlahkan Norma Produk independen kami mendapatkan distribusi yang tetap simetris di sekitar nol. Sebagai contoh:

masukkan deskripsi gambar di sini

Tetapi jika kita menjumlahkan Normal Produk yang tidak independen seperti kasus kita, kita dapatkan

masukkan deskripsi gambar di sini

yang condong ke kanan tetapi dengan massa probabilitas lebih dialokasikan untuk nilai-nilai negatif. Dan massa tampak semakin terdorong ke kiri jika kita menambah ukuran sampel dan menambahkan lebih banyak elemen yang berkorelasi dengan jumlah.

Kebalikan dari jumlah Gammas non-independen adalah variabel acak non-negatif dengan kemiringan positif.

ρ^1

Alecos Papadopoulos
sumber
Wow, analisis yang bagus! Bisakah Anda menunjukkan asumsi OLS standar mana yang dilanggar di sini?
Richard Hardy
@ RichardHardy Terima kasih. Saya akan kembali lagi nanti untuk menanggapi komentar Anda.
Alecos Papadopoulos
Saya masih penasaran dengan asumsi OLS ... Terima kasih sebelumnya!
Richard Hardy
Xt+1=αXt+ϵXt+1Xt
ρ^<1ρ^1
6

Ini sebenarnya bukan jawaban tetapi terlalu lama untuk komentar, jadi saya tetap memposting ini.

Saya bisa mendapatkan koefisien lebih besar dari 1 dua kali dari seratus untuk ukuran sampel 100 (menggunakan "R"):

N=100                   # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~y[-T])    # regress y on its own first lag, with intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

Realisasi 84 dan 95 memiliki koefisien di atas 1, sehingga tidak selalu di bawah satu. Namun, kecenderungannya jelas memiliki estimasi bias ke bawah. Pertanyaannya tetap, mengapa ?

Sunting: regresi di atas termasuk istilah intersepsi yang tampaknya tidak termasuk dalam model. Setelah intersep dihapus, saya mendapatkan lebih banyak perkiraan di atas 1 (3158 dari 10.000) - tetapi masih jelas di bawah 50% dari semua kasus:

N=10000                 # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~-1+y[-T]) # regress y on its own first lag, without intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1
Richard Hardy
sumber
tepatnya, bukan "selalu" minor tetapi di sebagian besar kasus. Ini jelas hasil yang palsu. mengapa alasannya?
Marco
2
xtxt1