pengantar
Ketertarikan saya pada topik sekarang sekitar 7 tahun dan menghasilkan tesis PhD. Time series: agregasi, disagregasi, dan ingatan yang panjang , di mana perhatian diberikan pada pertanyaan spesifik masalah disagregasi cross-sectional untuk skema AR (1).
Data
Bekerja dengan pendekatan agregasi yang berbeda, pertanyaan pertama yang perlu Anda klarifikasi adalah jenis data apa yang Anda tangani (tebakan saya adalah spasial, yang paling mendebarkan). Dalam praktiknya Anda dapat mempertimbangkan agregasi temporal (lihat Silvestrini, A. dan Veridas, D. (2008) ), cross-sectional (Saya menyukai artikel dari Granger, CWJ (1990) ) atau keduanya waktu dan ruang (agregasi spasial disurvei dengan baik. dalam Giacomini, R. dan Granger, CWJ (2004) ).
Jawaban (panjang)
Sekarang, menjawab pertanyaan Anda, saya menempatkan intuisi kasar pertama. Karena masalah yang saya temui dalam praktik sering kali didasarkan pada data yang tidak tepat (asumsi Andy
Anda dapat mengukur serangkaian pengamatan pada setiap tingkat ketepatan waktu
tampaknya terlalu kuat untuk makro-ekonometrika, tetapi bagus untuk keuangan dan mikro-ekonometrik atau bidang eksperimental apa pun, seandainya Anda mengontrol ketepatannya dengan baik) Saya harus ingat bahwa rangkaian waktu bulanan saya kurang tepat daripada ketika saya bekerja dengan data tahunan. Selain itu deret waktu yang lebih sering setidaknya dalam makroekonomi memang memiliki pola musiman , yang bisa berujung palsuhasil (bagian musiman tidak berkorelasi bukan seri), jadi Anda perlu menyesuaikan data secara musiman - sumber presisi lebih kecil untuk data frekuensi lebih tinggi. Bekerja dengan data cross-sectional mengungkapkan bahwa disagregasi tingkat tinggi membawa lebih banyak masalah dengan banyak kemungkinan nol untuk ditangani. Misalnya, rumah tangga tertentu dalam panel data dapat membeli mobil sekali per 5-10 tahun, tetapi permintaan agregat untuk mobil baru (bekas) jauh lebih lancar (bahkan untuk kota atau wilayah kecil).
The titik terlemah agregasi selalu mengakibatkan hilangnya informasi, Anda mungkin memiliki PDB yang dihasilkan oleh penampang negara-negara UE selama satu dekade penuh (katakanlah periode 2001-2010), tetapi Anda akan kehilangan semua fitur dinamis yang mungkin ada dalam analisis Anda dengan mempertimbangkan kumpulan data panel yang terperinci. Agregasi cross-sectional skala besar mungkin berubah menjadi lebih menarik: Anda, secara kasar, mengambil hal-hal sederhana (memori pendek AR (1)) rata-rata mereka atas populasi yang cukup besar dan mendapatkan agen memori panjang "representatif" yang tidak menyerupai mikro unit (satu batu lagi ke konsep agen perwakilan). Jadi agregasi ~ kehilangan informasi ~ properti yang berbeda dari objek dan Anda ingin mengendalikan tingkat kehilangan ini dan / atau properti baru. Menurut pendapat saya, lebih baik untuk memiliki data tingkat mikro yang tepat pada frekuensi setinggi mungkin, tetapi ...
Secara teknis menghasilkan setiap analisis regresi yang Anda perlukan lebih banyak ruang (derajat kebebasan) untuk lebih atau kurang percaya diri bahwa (setidaknya) secara statistik hasil Anda bukan sampah, meskipun mereka mungkin masih teoretis dan sampah :) Jadi saya menempatkan sama bobot untuk pertanyaan 1 dan 2 (biasanya memilih data triwulanan untuk analisis makro). Menjawab pertanyaan ke-3, semua yang Anda putuskan dalam aplikasi praktis apa yang lebih penting bagi Anda: data yang lebih tepat atau tingkat kebebasan. Jika Anda mempertimbangkan asumsi yang disebutkan, data yang lebih rinci (atau frekuensi yang lebih tinggi) lebih disukai.
Mungkin jawabannya akan diedit setelah beberapa jenis diskusi jika ada.