Ini mungkin pertanyaan yang aneh sama sekali tetapi sebagai seorang pemula untuk subjek saya bertanya-tanya mengapa kita menggunakan regresi untuk menentukan deret waktu jika salah satu asumsi regresi adalah data yang harus ditampung sedangkan data yang digunakan regresi adalah bukan iid?
regression
time-series
trend
iid
FarrukhJ
sumber
sumber
Jawaban:
Anda cerdas dalam merasakan bahwa mungkin ada pertentangan antara asumsi klasik dari regresi linear kuadrat terkecil biasa dan ketergantungan serial yang biasa ditemukan dalam pengaturan deret waktu.
Pertimbangkan Asumsi 1.2 (Exogeneity Ketat) dari Ekonometrik Fumio Hayashi .
Ini pada gilirannya menyiratkan , bahwa setiap sisa ϵ i adalah ortogonal untuk setiap regresi x j . Seperti yang ditunjukkan oleh Hayashi, asumsi ini dilanggar dalam model autoregresif yang paling sederhana . [1] Pertimbangkan proses AR (1):E[ϵixj]=0 ϵi xj
Kita bisa melihat bahwa akan menjadi regressor untuk y t + 1 , tapi ε t tidak ortogonal y t (yaitu E [ ε t y t ] ≠ 0 ).yt yt+1 ϵt yt E[ϵtyt]≠0
Karena asumsi eksogenitas yang ketat dilanggar, tidak ada argumen yang mengandalkan asumsi yang dapat diterapkan pada model AR (1) sederhana ini!
Jadi kita punya masalah yang sulit dipecahkan?
Tidak, kami tidak! Memperkirakan model AR (1) dengan kuadrat terkecil biasa sepenuhnya berlaku, perilaku standar. Kenapa masih bisa ok?
Sampel besar, argumen asimptotik tidak perlu exogeniety yang ketat. Asumsi yang cukup (yang dapat digunakan sebagai pengganti eksogenitas yang ketat) adalah bahwa regressor telah ditentukan sebelumnya , bahwa regressor adalah ortogonal dari istilah kesalahan kontemporer. Lihat Hayashi Bab 2 untuk argumen lengkap.
Referensi
[1] Fumio Hayashi, Econometrics (2000), hal. 35
[2] ibid., Hlm. 134
sumber
Metode regresi tipe kuadrat-dasar tidak menganggap bahwa nilai-y adalah iid. Mereka menganggap bahwa residual (yaitu nilai-y dikurangi tren sebenarnya) adalah iid
Metode regresi lain ada yang membuat asumsi yang berbeda, tetapi itu mungkin terlalu rumit jawaban ini.
sumber
Itu pertanyaan yang bagus! Masalahnya bahkan tidak disebutkan di buku seri waktu saya (saya mungkin perlu buku yang lebih baik :) Pertama-tama, perhatikan bahwa Anda tidak dipaksa untuk menggunakan regresi linier untuk menentukan urutan waktu, jika seri memiliki tren stokastik (unit root )- Anda bisa mengambil perbedaan pertama. Tetapi Anda harus menggunakan regresi linier, jika seri memiliki tren deterministik. Dalam hal ini memang benar bahwa residu tidak iid, seperti yang Anda katakan. Bayangkan saja seri yang memiliki tren linier, komponen musiman, komponen siklik, dll. Semuanya bersama-sama - setelah regresi linier, residu semuanya independen. Intinya adalah bahwa Anda tidak menggunakan regresi linier untuk membuat prediksi atau untuk membentuk interval prediksi. Ini hanya bagian dari prosedur inferensi Anda: Anda masih perlu menerapkan metode lain untuk sampai pada residu yang tidak berkorelasi. Jadi, sementara regresi linier per se bukan prosedur inferensi yang valid (ini bukan model statistik yang benar) untuk sebagian besar rangkaian waktu, prosedur yang menyertakan regresi linier sebagai salah satu langkahnya mungkin merupakan model yang valid, jika model yang diasumsikan sesuai dengan proses pembuatan data untuk seri waktu.
sumber