Regresi dengan frekuensi berbeda

10

Saya mencoba menjalankan regresi sederhana tetapi variabel Y saya diamati pada frekuensi bulanan dan x variabel diamati pada frekuensi tahunan. Saya akan sangat menghargai beberapa panduan tentang pendekatan yang cocok yang dapat digunakan untuk regresi dengan frekuensi yang berbeda.

Terima kasih banyak

magnaJ
sumber
Jika Anda menganggap hubungan itu sebagai hubungan sebab-akibat, mungkin perlu dipertimbangkan bagaimana, tepatnya, Anda melihat tanda X mengarah ke Y - seringkali akan membuat strategi potensial lebih jelas. Bagaimana hal tahunan Anda mengarah pada hasil pada hal bulanan Anda? Apakah X proxy untuk sesuatu yang lain, atau apakah Y benar-benar bergantung pada tahunan-X?
Glen_b -Reinstate Monica

Jawaban:

6

Tiga kemungkinan mengikuti. Tergantung pada situasinya, siapa pun bisa cocok.

  1. Agregasi waktu atau dis-agregasi.

Ini mungkin merupakan pendekatan paling sederhana di mana Anda mengubah data frekuensi tinggi (bulanan) menjadi data tahunan dengan, katakanlah, mengambil jumlah, rata-rata, atau nilai akhir periode. Data frekuensi rendah (tahunan), tentu saja, dapat dikonversi menjadi data bulanan dengan menggunakan beberapa teknik interpolasi; misalnya, menggunakan prosedur Chow-Lin. Mungkin bermanfaat untuk merujuk ke tempdisaggpaket untuk ini: http://cran.r-project.org/web/packages/tempdisagg/index.html .

  1. Mi (xed) da (ta) s (ampling) (MIDAS).

Regresi Midas, dipopulerkan oleh Eric Ghysels, adalah pilihan kedua. Ada dua ide utama di sini. Yang pertama adalah penyelarasan frekuensi. Yang kedua adalah untuk mengatasi kutukan dimensi dengan menentukan polinomial yang sesuai. Model MIDAS yang tidak dibatasi adalah yang paling sederhana dari dalam kelas model dan dapat diperkirakan dengan kuadrat terkecil biasa. Rincian lebih lanjut dan bagaimana menerapkan model-model ini dalam Rmenggunakan midasrpaket dapat ditemukan di sini: http://mpiktas.github.io/midasr/ . Untuk MATLAB, lihat halaman Ghysels ': http://www.unc.edu/~eghysels/ .

  1. Metode filter Kalman.

Ini adalah pendekatan pemodelan ruang-negara, yang melibatkan memperlakukan data frekuensi rendah sebagai mengandung NA dan mengisinya dengan menggunakan filter Kalman. Ini adalah preferensi pribadi saya, tetapi memiliki kesulitan menentukan model ruang-negara yang benar.

Untuk melihat lebih dalam tentang pro dan kontra dari metode ini, lihat State Space Models dan MIDAS Regresi oleh Jennie Bai, Eric Ghysels dan Jonathan H. Wright (2013).

Graeme Walsh
sumber
Ada beberapa implementasi MiDAS di python juga: github.com/mikemull/midaspy
Rafael Valero