Mengapa menggunakan data cross-sectional untuk menyimpulkan / memprediksi perubahan longitudinal adalah Hal yang Buruk?

11

Saya mencari kertas yang saya harap ada, tetapi tidak tahu apakah itu ada. Ini bisa berupa serangkaian studi kasus, dan / atau argumen dari teori probabilitas, tentang mengapa menggunakan data cross-sectional untuk menyimpulkan / memprediksi perubahan longitudinal mungkin merupakan Hal yang Buruk (yaitu tidak selalu demikian, tetapi dapat dilakukan).

Saya telah melihat kesalahan yang dilakukan dalam beberapa hal besar: kesimpulan dibuat bahwa karena orang yang lebih kaya di Inggris lebih banyak bepergian, maka ketika masyarakat semakin kaya, populasi secara keseluruhan akan lebih banyak melakukan perjalanan. Kesimpulan itu ternyata tidak benar untuk periode yang panjang - lebih dari satu dekade. Dan pola yang sama dengan penggunaan listrik rumah tangga: data cross-sectional menyiratkan peningkatan besar dengan pendapatan, yang tidak terwujud seiring waktu.

Ada beberapa hal yang terjadi, termasuk efek kohort dan kendala sisi penawaran.

Akan sangat berguna untuk memiliki referensi tunggal yang menyusun studi kasus seperti itu; dan / atau menggunakan teori probabilitas untuk menggambarkan mengapa menggunakan data cross-sectional untuk menyimpulkan / memprediksi perubahan longitudinal bisa sangat menyesatkan.

Apakah kertas semacam itu ada, dan jika demikian, apakah itu?

references panel-data inference causality cross-section 410 hilang
sumber

2

Saya percaya para ekonom akan berpikir tentang fenomena ini sebagai semacam efek keseimbangan umum. Stats orang menyebutnya pelanggaran Asumsi Nilai Pengobatan Unit Stabil. Saya pikir masalah panel vs cross section sedikit herring merah.

Dimitriy V. Masterov

2

Anda sebagian menjawab pertanyaan Anda sendiri dengan meminta perubahan "longitudinal". Data penampang disebut karena mereka mengambil bidikan cepat dalam waktu, secara harfiah penampang dipotong dari masyarakat yang berkembang waktu dengan banyak hubungannya. Oleh karena itu, kesimpulan terbaik yang dapat Anda lakukan adalah dengan asumsi bahwa apa pun yang Anda pelajari adalah invarian waktu, atau paling tidak telah menyimpulkan evolusinya.

Di sisi lain, data yang Anda cari adalah data longitudinal atau data panel untuk Ekonom.

Referensi yang baik yang menjelaskan sebagian besar metode tetapi juga menyoroti dua contoh terkemuka dari Ekonomi ada di sini . Contoh 2.1 memiliki tingkat investasi perusahaan.

Bagian 3 sedikit lebih teoretis tetapi membawa banyak wawasan: model data panel dapat

\begin{array}{rcl} y_{i, t} = α y_{i, t - 1} + x_{i, t} γ + η_{i} + v_{i, t} . \end{array}

$\begin{eqnarray} y_{i,t} = \alpha y_{i,t-1} + x_{i,t} \gamma + \eta_{i} + v_{i,t}. \end{eqnarray}$

Sekarang, jenis model ini dapat menangkap ketergantungan negara, yang (di samping heterogenitas yang tidak teramati) merupakan penjelasan umum mengapa orang berperilaku berbeda. Karena itu, jika Anda hanya mengamati orang-orang yang bepergian pada suatu titik waktu tertentu, akan teridentifikasi, artinya Anda tidak mengetahui seberapa banyak perjalanan mereka kemarin mempengaruhi keputusan mereka untuk bepergian lagi. $\alpha$

Sekarang, matikan ketergantungan waktu sesaat tetapi perlu diingat bahwa persamaan ini mungkin adalah model yang sebenarnya.

Dalam model penampang sekarang, Anda akan menjatuhkan seluruhnya subskrip karena Anda hanya memiliki data dalam satu periode. Oleh karena itu, Anda juga tidak memiliki kemungkinan untuk memperhitungkan fakta bahwa setiap individu dalam kumpulan data Anda mungkin sangat berbeda , yang akan membuat bias Anda naik ke atas secara umum, setidaknya ketika model yang sebenarnya adalah dinamis. Ini mungkin merupakan alasan dari perkiraan yang terlalu tinggi, karena efek individu yang tidak teramati (bisa juga umum), yang Anda tidak ukur tetapi itu tercermin dalam penelitian lintas-bagian Anda. $t$ $\eta_{i}'s$

Sekarang, masukkan data panel lagi. Apa yang bisa kita lakukan adalah mengurangi rata-rata dari waktu ke waktu setiap variabel yang, mengingat rata-rata adalah konstan dari waktu ke waktu, akan menghilangkan istilah ini. Transformasi ini (yang lain dimungkinkan) memungkinkan Anda untuk fokus hanya pada dinamika (dan pada kenyataannya Anda akan kehilangan setiap regresor invarian waktu). $\eta_i$

Sekarang, ini adalah perbedaan utama antara data penampang dan panel. Fakta bahwa Anda dapat menghilangkan efek time-invariant karena Anda memiliki variasi waktu yang memungkinkan Anda untuk menghapus bias tertentu yang estimasi lintas-bagian tidak memungkinkan Anda untuk mendeteksi. Karena itu, sebelum Anda merenungkan perubahan kebijakan seperti pajak yang lebih tinggi untuk perjalanan karena Anda mengharapkan orang untuk bepergian dan Anda menginginkan lebih banyak pendapatan pemerintah, lebih bermanfaat untuk melihat fenomena tersebut selama beberapa tahun sehingga Anda dapat yakin bahwa Anda tidak menangkap heterogenitas yang tidak teramati dalam sampel Anda yang Anda tafsirkan sebagai kecenderungan untuk bepergian.

Untuk memperkirakan model-model ini, yang terbaik adalah melalui referensi. Namun waspadalah: asumsi berbeda tentang perilaku orang akan membuat prosedur estimasi yang berbeda diterima atau tidak.

Saya harap ini membantu!

Hirek
sumber

1

Kedengarannya sangat mirip dengan definisi proses non-ergodik (ukuran atas realisasi tidak sama dengan ukuran dari waktu ke waktu). Sayangnya, sangat sedikit fenomena dunia nyata yang menarik yang ergodik. Saya kira ini bisa menjadi kasus untuk pengambilan sampel dan kesimpulan berskala lebih halus, di mana penyederhanaan tertentu mungkin dilakukan. Saya sedang memikirkan contoh skala waktu atau spasial kecil, di mana perilaku kacau tidak diamati sehingga prediktor dapat linierisasi. Tapi saya hanya bertele-tele di sini .. Saya khawatir saya tidak bisa membantu Anda dengan literatur khusus tentang topik itu. Maaf: / Namun pertanyaan menarik

ocramz
sumber

Mengapa menggunakan data cross-sectional untuk menyimpulkan / memprediksi perubahan longitudinal adalah Hal yang Buruk?

Jawaban: