Apa yang harus dibuat dari penjelasan dalam rangkaian waktu?

11

Setelah bekerja sebagian besar dengan data cross sectional sejauh ini dan sangat baru-baru ini browsing, pemindaian tersandung melalui sekelompok literatur seri waktu pengantar Aku bertanya-tanya apa peran variabel penjelas peran yang dimainkan dalam analisis deret waktu.

Saya ingin menjelaskan tren alih-alih tren. Sebagian besar dari apa yang saya baca sebagai pengantar mengasumsikan bahwa seri ini berasal dari beberapa proses stokastik. Saya membaca tentang proses AR (p) dan MA serta pemodelan ARIMA. Ingin menangani lebih banyak informasi daripada hanya proses autoregresif saya menemukan VAR / VECM dan menjalankan beberapa contoh, tetapi saya masih bertanya-tanya apakah ada beberapa kasus yang terkait lebih dekat dengan apa yang dilakukan oleh penjelas dalam lintas bagian.

Motivasi di balik ini adalah bahwa dekomposisi seri saya menunjukkan bahwa tren adalah kontributor utama sementara sisanya dan efek musiman hampir tidak berperan. Saya ingin menjelaskan tren ini.

Bisakah / saya harus mundur seri saya pada beberapa seri yang berbeda? Secara intuitif saya akan menggunakan gls karena korelasi serial (saya tidak begitu yakin tentang struktur cor). Saya mendengar tentang regresi palsu dan memahami bahwa ini adalah jebakan, namun saya mencari cara untuk menjelaskan tren.

Apakah ini sepenuhnya salah atau tidak biasa? Atau apakah saya baru saja melewatkan bab yang tepat sejauh ini?

hans0l0
sumber

Jawaban:

15

Berdasarkan komentar yang Anda tawarkan kepada tanggapan, Anda harus menyadari penyebab palsu . Setiap variabel dengan tren waktu akan dikorelasikan dengan variabel lain yang juga memiliki tren waktu. Misalnya, berat badan saya sejak lahir hingga usia 27 tahun akan sangat berkorelasi dengan berat badan Anda sejak lahir hingga usia 27 tahun. Jelas, berat badan saya tidak disebabkan oleh berat badan Anda. Jika ya, saya minta Anda pergi ke gym lebih sering.

Karena Anda terbiasa dengan data penampang, saya akan memberi Anda penjelasan variabel yang dihilangkan. Biarkan berat saya menjadi dan berat Anda menjadi , di mana xtyt

xt=α0+α1t+ϵt andyt=β0+β1t+ηt.

Kemudian regresi memiliki variabel yang dihilangkan --- tren waktu --- yang berkorelasi dengan variabel yang disertakan, . Karenanya, koefisien akan menjadi bias (dalam hal ini, itu akan menjadi positif, karena bobot kita bertambah seiring waktu).

yt=γ0+γ1xt+νt
xtγ1

Saat Anda melakukan analisis deret waktu, Anda harus yakin bahwa variabel Anda diam atau Anda akan mendapatkan hasil sebab-akibat palsu ini. Pengecualian adalah seri terintegrasi, tetapi saya akan merujuk Anda ke teks seri waktu untuk mendengar lebih banyak tentang itu.

Charlie
sumber
5
+1 sebagai contoh regresi palsu. Akan mempekerjakannya di kuliah :)
mpiktas
1
Eh, Anda pergi ke gym untuk menurunkan berat badan? :)
hans0l0
6

Intuisi yang sama seperti dalam regresi cross-section dapat digunakan dalam regresi time-series. Sangat valid untuk mencoba menjelaskan tren menggunakan variabel lain. Perbedaan utama adalah bahwa secara implisit diasumsikan bahwa regresi adalah variabel acak. Jadi dalam model regresi:

Yt=β0+Xt1β1+...+Xtkβk+εt

kita memerlukan sebagai ganti dan bukannya .E ε t = 0 E ( ε 2 t | X t 1 , . . . , X t k ) = σ 2 E ε 2 t = σ 2E(εt|Xt1,...,Xtk)=0Eεt=0E(εt2|Xt1,...,Xtk)=σ2Eεt2=σ2

Bagian praktis dari regresi tetap sama, semua statistik dan metode yang biasa berlaku.

Bagian yang sulit adalah untuk menunjukkan jenis variabel acak mana, atau dalam kasus ini proses stokastik kita dapat menggunakan metode klasik. Teorema batas pusat biasa tidak dapat diterapkan, karena melibatkan variabel acak independen. Proses deret waktu biasanya tidak independen. Di sinilah pentingnya stasioneritas berperan. Ditunjukkan bahwa untuk sebagian besar proses stasioner teorema limit pusat dapat diterapkan, sehingga analisis regresi klasik dapat diterapkan.Xtk

Peringatan utama dari regresi deret waktu adalah bahwa ia dapat gagal secara besar-besaran ketika regresor tidak diam. Maka metode regresi biasa dapat menunjukkan bahwa tren dijelaskan, padahal sebenarnya tidak. Jadi, jika Anda ingin menjelaskan tren, Anda harus memeriksa non-stasioneritas sebelum melanjutkan. Kalau tidak, Anda mungkin sampai pada kesimpulan yang salah.

mpiktas
sumber
1
Terima kasih atas kesabaran Anda. Namun PDB bisa menjadi penjelasan yang mungkin untuk variabel saya. Mungkin saya lebih baik menggunakan tingkat pertumbuhan karena kalau tidak itu hanya mewakili tren waktu di sini. Alasan mengapa saya ingin menggunakan regresi adalah karena saya tertarik untuk mengekstraksi apa yang sebenarnya TIDAK dijelaskan oleh variabel tren waktu seperti PDB.
hans0l0
1
@ ran2, selalu lebih baik menggunakan pertumbuhan PDB daripada nilai riilnya. Perhatikan bahwa analisis regresi juga dapat memberi tahu Anda variabel apa yang tidak menjelaskan tren, sehingga Anda mungkin berakhir dengan hasil bahwa tidak ada variabel yang dapat menjelaskan tren Anda (atau variabel yang Anda pikirkan tidak menjelaskan tren).
mpiktas
1
@raegtin, proses stasioner yang tidak memiliki momen kedua misalnya.
mpiktas
1
Satu-satunya hal yang akan saya tambahkan adalah berhati-hati dengan penggunaan dunia "jelaskan". Beberapa pengulas tidak akan menyukai ini.
Jase
1
@Jase, baik saya menggunakan istilah dalam arti OP bertanya, yaitu menemukan hubungan statistik yang bermakna.
mpiktas
3

Ketika Anda memiliki seri pendukung / kausal / membantu / sisi kanan / eksogen / prediktor, pendekatan yang lebih disukai adalah dengan membangun persamaan tunggal, Fungsi Transfer multi-input. Kita perlu memeriksa kemungkinan residu model untuk input deterministik yang tidak ditentukan / dihilangkan yaitu melakukan Deteksi Intervensi ala Ruey Tsay 1988 Journal of Forecasting dan input stokastik yang tidak ditentukan melalui komponen ARIMA. Dengan demikian Anda dapat secara eksplisit memasukkan tidak hanya kausal yang disarankan pengguna (dan keterlambatan yang diperlukan!) Tetapi dua jenis struktur yang dihilangkan (boneka dan ARIMA).

Perhatian harus diberikan untuk memastikan bahwa parameter dari model akhir tidak berubah secara signifikan dari waktu ke waktu jika tidak segmentasi data dapat dilakukan dan residu dari model akhir tidak dapat terbukti memiliki varians heterogen.

Tren dalam seri asli mungkin disebabkan oleh tren dalam seri prediktor atau karena dinamika Autoregresif dalam rangkaian minat atau berpotensi karena seri deterministik yang dihilangkan yang diproksikan dengan konstanta kondisi stabil atau bahkan satu atau lebih tren waktu lokal.

IrishStat
sumber
0

Sebagai sudut pandang yang kurang teknis, sering kali itu tidak terlalu membantu hanya menjelaskan tren; yaitu, memperlakukan waktu sebagai prediktor minat utama. Variasi seri dari waktu ke waktu sering menyiratkan efek mendasar dari variabel lain, termasuk proses autoregresif dan / atau eksogen, yang lebih relevan secara konseptual untuk diselidiki. Oleh karena itu, jika variabel-variabel tersebut juga bervariasi dari waktu ke waktu, maka mengendalikan efek waktu sebenarnya diperlukan untuk tidak jatuh dalam hubungan artifisial yang signifikan seperti yang ditunjukkan oleh @mpiktas.

NonSleeper
sumber