Mengapa valid untuk menentukan deret waktu dengan regresi?

14

Ini mungkin pertanyaan yang aneh sama sekali tetapi sebagai seorang pemula untuk subjek saya bertanya-tanya mengapa kita menggunakan regresi untuk menentukan deret waktu jika salah satu asumsi regresi adalah data yang harus ditampung sedangkan data yang digunakan regresi adalah bukan iid?

FarrukhJ
sumber
6
Secara umum tidak benar bahwa kita membuat asumsi bahwa "data" itu benar
Christoph Hanck
3
Apa maksud Anda tepatnya dengan detrend ?
Matthew Gunn
6
Saya tidak punya waktu untuk menulis jawaban / dokumen yang tepat ini, tetapi secara umum korelasi serial tidak bias hasil regresi linier (itu mengubah perhitungan yang sesuai dari kesalahan standar, interval kepercayaan, dll). Ini membuat pendekatan dua tahap klasik (detrend, lalu analisis korelasinya) masuk akal. (misalnya beberapa googling "regresi linier korelasi serial mengarah ke fmwww.bc.edu/ec-c/f2010/228/EC228.f2010.nn12.pdf )
Ben Bolker
2
Mungkin yang lebih penting, OLS estimator koefisien pada trend linear konvergen seluruh urutan besarnya lebih cepat (pada tingkat ) untuk nilai yang sebenarnya daripada regressors stasioner ( n - 1 / 2 ), yang berarti Anda dapat secara konsisten memperkirakan tren bahkan jika Anda mengabaikan variabel stasioner. Ini berbeda dengan memperkirakan efek variabel stasioner satu per satu, di mana Anda kehilangan konsistensi jika Anda menghilangkan variabel. n3/2n1/2
Richard Hardy

Jawaban:

15

Anda cerdas dalam merasakan bahwa mungkin ada pertentangan antara asumsi klasik dari regresi linear kuadrat terkecil biasa dan ketergantungan serial yang biasa ditemukan dalam pengaturan deret waktu.

Pertimbangkan Asumsi 1.2 (Exogeneity Ketat) dari Ekonometrik Fumio Hayashi .

E[ϵiX]=0

Ini pada gilirannya menyiratkan , bahwa setiap sisa ϵ i adalah ortogonal untuk setiap regresi x j . Seperti yang ditunjukkan oleh Hayashi, asumsi ini dilanggar dalam model autoregresif yang paling sederhana . [1] Pertimbangkan proses AR (1):E[ϵixj]=0ϵixj

yt=βyt1+ϵt

Kita bisa melihat bahwa akan menjadi regressor untuk y t + 1 , tapi ε t tidak ortogonal y t (yaitu E [ ε t y t ] 0 ).ytyt+1ϵtytE[ϵtyt]0

Karena asumsi eksogenitas yang ketat dilanggar, tidak ada argumen yang mengandalkan asumsi yang dapat diterapkan pada model AR (1) sederhana ini!

Jadi kita punya masalah yang sulit dipecahkan?

Tidak, kami tidak! Memperkirakan model AR (1) dengan kuadrat terkecil biasa sepenuhnya berlaku, perilaku standar. Kenapa masih bisa ok?

Sampel besar, argumen asimptotik tidak perlu exogeniety yang ketat. Asumsi yang cukup (yang dapat digunakan sebagai pengganti eksogenitas yang ketat) adalah bahwa regressor telah ditentukan sebelumnya , bahwa regressor adalah ortogonal dari istilah kesalahan kontemporer. Lihat Hayashi Bab 2 untuk argumen lengkap.

Referensi

[1] Fumio Hayashi, Econometrics (2000), hal. 35

[2] ibid., Hlm. 134

Matthew Gunn
sumber
6

Metode regresi tipe kuadrat-dasar tidak menganggap bahwa nilai-y adalah iid. Mereka menganggap bahwa residual (yaitu nilai-y dikurangi tren sebenarnya) adalah iid

Metode regresi lain ada yang membuat asumsi yang berbeda, tetapi itu mungkin terlalu rumit jawaban ini.

Geoffrey Brent
sumber
5
Asumsi yang juga jelas salah: pikirkan saja deret waktu dengan tren linier, dan musiman. Sisa residu dari regresi linier jelas berkorelasi, sehingga tidak iid.
DeltaIV
3

Itu pertanyaan yang bagus! Masalahnya bahkan tidak disebutkan di buku seri waktu saya (saya mungkin perlu buku yang lebih baik :) Pertama-tama, perhatikan bahwa Anda tidak dipaksa untuk menggunakan regresi linier untuk menentukan urutan waktu, jika seri memiliki tren stokastik (unit root )- Anda bisa mengambil perbedaan pertama. Tetapi Anda harus menggunakan regresi linier, jika seri memiliki tren deterministik. Dalam hal ini memang benar bahwa residu tidak iid, seperti yang Anda katakan. Bayangkan saja seri yang memiliki tren linier, komponen musiman, komponen siklik, dll. Semuanya bersama-sama - setelah regresi linier, residu semuanya independen. Intinya adalah bahwa Anda tidak menggunakan regresi linier untuk membuat prediksi atau untuk membentuk interval prediksi. Ini hanya bagian dari prosedur inferensi Anda: Anda masih perlu menerapkan metode lain untuk sampai pada residu yang tidak berkorelasi. Jadi, sementara regresi linier per se bukan prosedur inferensi yang valid (ini bukan model statistik yang benar) untuk sebagian besar rangkaian waktu, prosedur yang menyertakan regresi linier sebagai salah satu langkahnya mungkin merupakan model yang valid, jika model yang diasumsikan sesuai dengan proses pembuatan data untuk seri waktu.

DeltaIV
sumber
3
Jangan berdiferensiasi jika Anda memiliki tren deterministik - diferensiasi hanya sesuai untuk tren stokastik (unit root). Jika Anda membedakan seri tanpa root unit, Anda akan memperkenalkan jenis kesalahan rata-rata bergerak terintegrasi dalam model, dan itu tidak menyenangkan.
Richard Hardy
1
Saya pikir maksud Anda perbedaan, bukan membedakan.
Hong Ooi
yt=β0+β1yt1+ϵt
1
@ Haiooi, ya, salahku, maksudku berbeda, bukan diferensiasi. DeltaIV, deret waktu dikatakan memiliki tren stokastik jika deret waktu merupakan proses terintegrasi (= unit-root). Ini adalah istilah standar dalam literatur unit-root dan kointegrasi. Saya bertanya-tanya apakah itu memiliki arti yang berbeda di untaian sastra lainnya. Dalam setiap kasus, over-differencing (= membedakan deret waktu yang tidak memiliki akar unit) adalah fenomena yang terkenal, dan harus dihindari.
Richard Hardy
y=β0+beta1x1