Bagaimana Anda memilih unit analisis (tingkat agregasi) dalam rangkaian waktu?

Jika Anda dapat mengukur serangkaian pengamatan pada setiap tingkat ketepatan waktu, dan tujuan penelitian Anda adalah untuk mengidentifikasi hubungan antara X dan Y, apakah ada justifikasi empiris untuk memilih tingkat agregasi tertentu di atas yang lain, atau haruskah pilihan hanya diambil berdasarkan teori dan / atau keterbatasan praktis?

Saya punya tiga sub-pertanyaan untuk yang utama ini:

Apakah ada variasi non-acak dalam X atau Y dalam tingkat yang lebih besar cukup untuk memilih tingkat agregasi yang lebih kecil (di mana non-acak adalah pola temporal dari pengamatan)?
Apakah ada variasi dalam hubungan antara X dan Y pada tingkat agregasi yang lebih kecil alasan yang cukup untuk membenarkan unit analisis yang lebih kecil? Jika beberapa variasi dapat diterima, bagaimana seseorang memutuskan berapa banyak variasi terlalu banyak?
Dapatkah orang mengutip argumen yang mereka anggap menarik / didefinisikan dengan baik untuk satu unit analisis di atas yang lain, baik untuk alasan empiris atau untuk alasan teoritis?

Saya sangat menyadari masalah unit area yang dapat dimodifikasi dalam analisis spasial ( Openshaw 1984 ). Saya tidak mengklaim sebagai ahli dalam materi, tetapi semua yang saya pikirkan sejauh ini adalah bahwa unit analisis yang lebih kecil selalu lebih baik, karena orang cenderung melakukan kesalahan ekologi ( Robinson 1950 ). Jika seseorang memiliki referensi atau jawaban yang berkaitan langsung mengenai unit geografis agregasi, saya akan menghargai jawaban itu juga.

time-series aggregation disaggregation Andy W
sumber

pengantar

Ketertarikan saya pada topik sekarang sekitar 7 tahun dan menghasilkan tesis PhD. Time series: agregasi, disagregasi, dan ingatan yang panjang , di mana perhatian diberikan pada pertanyaan spesifik masalah disagregasi cross-sectional untuk skema AR (1).

Data

Bekerja dengan pendekatan agregasi yang berbeda, pertanyaan pertama yang perlu Anda klarifikasi adalah jenis data apa yang Anda tangani (tebakan saya adalah spasial, yang paling mendebarkan). Dalam praktiknya Anda dapat mempertimbangkan agregasi temporal (lihat Silvestrini, A. dan Veridas, D. (2008) ), cross-sectional (Saya menyukai artikel dari Granger, CWJ (1990) ) atau keduanya waktu dan ruang (agregasi spasial disurvei dengan baik. dalam Giacomini, R. dan Granger, CWJ (2004) ).

Jawaban (panjang)

Sekarang, menjawab pertanyaan Anda, saya menempatkan intuisi kasar pertama. Karena masalah yang saya temui dalam praktik sering kali didasarkan pada data yang tidak tepat (asumsi Andy

Anda dapat mengukur serangkaian pengamatan pada setiap tingkat ketepatan waktu

tampaknya terlalu kuat untuk makro-ekonometrika, tetapi bagus untuk keuangan dan mikro-ekonometrik atau bidang eksperimental apa pun, seandainya Anda mengontrol ketepatannya dengan baik) Saya harus ingat bahwa rangkaian waktu bulanan saya kurang tepat daripada ketika saya bekerja dengan data tahunan. Selain itu deret waktu yang lebih sering setidaknya dalam makroekonomi memang memiliki pola musiman , yang bisa berujung palsuhasil (bagian musiman tidak berkorelasi bukan seri), jadi Anda perlu menyesuaikan data secara musiman - sumber presisi lebih kecil untuk data frekuensi lebih tinggi. Bekerja dengan data cross-sectional mengungkapkan bahwa disagregasi tingkat tinggi membawa lebih banyak masalah dengan banyak kemungkinan nol untuk ditangani. Misalnya, rumah tangga tertentu dalam panel data dapat membeli mobil sekali per 5-10 tahun, tetapi permintaan agregat untuk mobil baru (bekas) jauh lebih lancar (bahkan untuk kota atau wilayah kecil).

The titik terlemah agregasi selalu mengakibatkan hilangnya informasi, Anda mungkin memiliki PDB yang dihasilkan oleh penampang negara-negara UE selama satu dekade penuh (katakanlah periode 2001-2010), tetapi Anda akan kehilangan semua fitur dinamis yang mungkin ada dalam analisis Anda dengan mempertimbangkan kumpulan data panel yang terperinci. Agregasi cross-sectional skala besar mungkin berubah menjadi lebih menarik: Anda, secara kasar, mengambil hal-hal sederhana (memori pendek AR (1)) rata-rata mereka atas populasi yang cukup besar dan mendapatkan agen memori panjang "representatif" yang tidak menyerupai mikro unit (satu batu lagi ke konsep agen perwakilan). Jadi agregasi ~ kehilangan informasi ~ properti yang berbeda dari objek dan Anda ingin mengendalikan tingkat kehilangan ini dan / atau properti baru. Menurut pendapat saya, lebih baik untuk memiliki data tingkat mikro yang tepat pada frekuensi setinggi mungkin, tetapi ...

Secara teknis menghasilkan setiap analisis regresi yang Anda perlukan lebih banyak ruang (derajat kebebasan) untuk lebih atau kurang percaya diri bahwa (setidaknya) secara statistik hasil Anda bukan sampah, meskipun mereka mungkin masih teoretis dan sampah :) Jadi saya menempatkan sama bobot untuk pertanyaan 1 dan 2 (biasanya memilih data triwulanan untuk analisis makro). Menjawab pertanyaan ke-3, semua yang Anda putuskan dalam aplikasi praktis apa yang lebih penting bagi Anda: data yang lebih tepat atau tingkat kebebasan. Jika Anda mempertimbangkan asumsi yang disebutkan, data yang lebih rinci (atau frekuensi yang lebih tinggi) lebih disukai.

Mungkin jawabannya akan diedit setelah beberapa jenis diskusi jika ada.

Dmitrij Celov
sumber

Terima kasih atas tanggapannya. Butuh waktu setidaknya beberapa hari untuk memproses materi yang Anda sajikan. Saya juga ingin mengatakan disertasi Anda sangat bagus dan setelah membaca pengantar Anda, saya berharap untuk membaca sisanya.

Andy W

Bagaimana Anda memilih unit analisis (tingkat agregasi) dalam rangkaian waktu?

Jawaban: