Setelah bekerja sebagian besar dengan data cross sectional sejauh ini dan sangat baru-baru ini browsing, pemindaian tersandung melalui sekelompok literatur seri waktu pengantar Aku bertanya-tanya apa peran variabel penjelas peran yang dimainkan dalam analisis deret waktu.
Saya ingin menjelaskan tren alih-alih tren. Sebagian besar dari apa yang saya baca sebagai pengantar mengasumsikan bahwa seri ini berasal dari beberapa proses stokastik. Saya membaca tentang proses AR (p) dan MA serta pemodelan ARIMA. Ingin menangani lebih banyak informasi daripada hanya proses autoregresif saya menemukan VAR / VECM dan menjalankan beberapa contoh, tetapi saya masih bertanya-tanya apakah ada beberapa kasus yang terkait lebih dekat dengan apa yang dilakukan oleh penjelas dalam lintas bagian.
Motivasi di balik ini adalah bahwa dekomposisi seri saya menunjukkan bahwa tren adalah kontributor utama sementara sisanya dan efek musiman hampir tidak berperan. Saya ingin menjelaskan tren ini.
Bisakah / saya harus mundur seri saya pada beberapa seri yang berbeda? Secara intuitif saya akan menggunakan gls karena korelasi serial (saya tidak begitu yakin tentang struktur cor). Saya mendengar tentang regresi palsu dan memahami bahwa ini adalah jebakan, namun saya mencari cara untuk menjelaskan tren.
Apakah ini sepenuhnya salah atau tidak biasa? Atau apakah saya baru saja melewatkan bab yang tepat sejauh ini?
sumber
Intuisi yang sama seperti dalam regresi cross-section dapat digunakan dalam regresi time-series. Sangat valid untuk mencoba menjelaskan tren menggunakan variabel lain. Perbedaan utama adalah bahwa secara implisit diasumsikan bahwa regresi adalah variabel acak. Jadi dalam model regresi:
kita memerlukan sebagai ganti dan bukannya .E ε t = 0 E ( ε 2 t | X t 1 , . . . , X t k ) = σ 2 E ε 2 t = σ 2E(εt|Xt1,...,Xtk)=0 Eεt=0 E(ε2t|Xt1,...,Xtk)=σ2 Eε2t=σ2
Bagian praktis dari regresi tetap sama, semua statistik dan metode yang biasa berlaku.
Bagian yang sulit adalah untuk menunjukkan jenis variabel acak mana, atau dalam kasus ini proses stokastik kita dapat menggunakan metode klasik. Teorema batas pusat biasa tidak dapat diterapkan, karena melibatkan variabel acak independen. Proses deret waktu biasanya tidak independen. Di sinilah pentingnya stasioneritas berperan. Ditunjukkan bahwa untuk sebagian besar proses stasioner teorema limit pusat dapat diterapkan, sehingga analisis regresi klasik dapat diterapkan.Xtk
Peringatan utama dari regresi deret waktu adalah bahwa ia dapat gagal secara besar-besaran ketika regresor tidak diam. Maka metode regresi biasa dapat menunjukkan bahwa tren dijelaskan, padahal sebenarnya tidak. Jadi, jika Anda ingin menjelaskan tren, Anda harus memeriksa non-stasioneritas sebelum melanjutkan. Kalau tidak, Anda mungkin sampai pada kesimpulan yang salah.
sumber
Ketika Anda memiliki seri pendukung / kausal / membantu / sisi kanan / eksogen / prediktor, pendekatan yang lebih disukai adalah dengan membangun persamaan tunggal, Fungsi Transfer multi-input. Kita perlu memeriksa kemungkinan residu model untuk input deterministik yang tidak ditentukan / dihilangkan yaitu melakukan Deteksi Intervensi ala Ruey Tsay 1988 Journal of Forecasting dan input stokastik yang tidak ditentukan melalui komponen ARIMA. Dengan demikian Anda dapat secara eksplisit memasukkan tidak hanya kausal yang disarankan pengguna (dan keterlambatan yang diperlukan!) Tetapi dua jenis struktur yang dihilangkan (boneka dan ARIMA).
Perhatian harus diberikan untuk memastikan bahwa parameter dari model akhir tidak berubah secara signifikan dari waktu ke waktu jika tidak segmentasi data dapat dilakukan dan residu dari model akhir tidak dapat terbukti memiliki varians heterogen.
Tren dalam seri asli mungkin disebabkan oleh tren dalam seri prediktor atau karena dinamika Autoregresif dalam rangkaian minat atau berpotensi karena seri deterministik yang dihilangkan yang diproksikan dengan konstanta kondisi stabil atau bahkan satu atau lebih tren waktu lokal.
sumber
Sebagai sudut pandang yang kurang teknis, sering kali itu tidak terlalu membantu hanya menjelaskan tren; yaitu, memperlakukan waktu sebagai prediktor minat utama. Variasi seri dari waktu ke waktu sering menyiratkan efek mendasar dari variabel lain, termasuk proses autoregresif dan / atau eksogen, yang lebih relevan secara konseptual untuk diselidiki. Oleh karena itu, jika variabel-variabel tersebut juga bervariasi dari waktu ke waktu, maka mengendalikan efek waktu sebenarnya diperlukan untuk tidak jatuh dalam hubungan artifisial yang signifikan seperti yang ditunjukkan oleh @mpiktas.
sumber