Apa cara yang benar untuk menentukan perbedaan dalam model perbedaan dengan data panel tingkat individu?
Ini adalah setup: Asumsikan bahwa saya memiliki data panel tingkat individu yang tertanam di kota selama beberapa tahun dan perawatan bervariasi pada tingkat kota-tahun. Secara formal, biarkan menjadi hasil bagi individu di kota dan tahun dan menjadi dummy untuk apakah intervensi yang terkena kota pada tahun . Estimator DiD tipikal seperti yang diuraikan dalam Bertrand et al (2004, hal. 250) didasarkan pada model OLS sederhana dengan ketentuan efek tetap untuk kota dan tahun:
Tetapi apakah estimator itu mengabaikan struktur panel tingkat individu (mis. Pengamatan ganda untuk setiap individu dalam kota)? Apakah masuk akal untuk memperluas model ini dengan istilah efek tetap tingkat individu ? Banyak aplikasi DID menggunakan data penampang berulang tanpa data panel level individu.
Bertrand, Marianne, Esther Duflo, dan Sendhil Mullainathan. 2004. "Berapa Banyak Kita Harus Percayai Estimasi Perbedaan-dalam-Perbedaan?" Jurnal Ekonomi Triwulanan 119 (1): 249–75.
Jawaban:
Fitur perbedaan-dalam-perbedaan (DiD) yang bagus sebenarnya adalah Anda tidak memerlukan data panel untuk itu. Mengingat bahwa perawatan terjadi pada semacam tingkat agregasi (di kota kasus Anda), Anda hanya perlu mengambil sampel individu acak dari kota-kota sebelum dan setelah perawatan. Hal ini memungkinkan Anda untuk memperkirakan dan mendapatkan efek kausal dari perawatan sebagai perbedaan hasil pasca-perkiraan yang diharapkan untuk diperlakukan dikurangi perbedaan hasil post-pre yang diharapkan untuk kontrol.
Ada kasus di mana orang menggunakan efek tetap individu alih-alih indikator pengobatan dan ini adalah ketika kita tidak memiliki tingkat agregasi yang terdefinisi dengan baik di mana pengobatan terjadi. Dalam hal ini Anda akan memperkirakan mana adalah indikator untuk periode pasca perawatan untuk individu yang menerima perawatan (misalnya, program pasar kerja yang terjadi di semua tempat). Untuk informasi lebih lanjut tentang ini, lihat catatan kuliah ini oleh Steve Pischke.
Di pengaturan Anda, menambahkan efek tetap individual tidak boleh mengubah apa pun sehubungan dengan perkiraan titik. Indikator pengobatan hanya akan diserap oleh efek tetap individu. Namun, efek-efek tetap ini mungkin menyerap sebagian dari varians residual dan karenanya berpotensi mengurangi kesalahan standar dari koefisien DiD Anda.Ag
Berikut adalah contoh kode yang menunjukkan bahwa ini adalah masalahnya. Saya menggunakan Stata tetapi Anda dapat meniru ini dalam paket statistik pilihan Anda. "Individu" di sini sebenarnya adalah negara tetapi mereka masih dikelompokkan berdasarkan beberapa indikator perawatan.
Jadi Anda melihat bahwa koefisien DiD tetap sama ketika masing-masing efek tetap dimasukkan (
areg
adalah salah satu perintah estimasi efek tetap yang tersedia di Stata). Kesalahan standar sedikit lebih ketat dan indikator pengobatan asli kami diserap oleh efek tetap individu dan oleh karena itu menurun dalam regresi.Menanggapi komentar yang
saya sebutkan contoh Pischke untuk menunjukkan ketika orang menggunakan efek tetap individu daripada indikator kelompok pengobatan. Pengaturan Anda memiliki struktur grup yang terdefinisi dengan baik sehingga cara Anda menulis model Anda baik-baik saja. Kesalahan standar harus dikelompokkan di tingkat kota, yaitu tingkat agregasi di mana perlakuan terjadi (saya belum melakukan ini dalam kode contoh tetapi dalam pengaturan DID kesalahan standar perlu diperbaiki seperti yang ditunjukkan oleh kertas Bertrand et al. ).
Mengenai penggerak, mereka tidak memiliki banyak peran untuk dimainkan di sini. Perlakuan Indikator adalah sama dengan 1 untuk orang-orang yang tinggal di kota dirawat di pos-pengolahan periode . Untuk menghitung koefisien DiD, kita sebenarnya hanya perlu menghitung empat harapan bersyarat, yaituDst s t
Jadi jika Anda memiliki 4 periode pasca perawatan untuk seorang individu yang tinggal di kota yang dirawat untuk dua yang pertama, dan kemudian pindah ke kota kontrol untuk dua periode yang tersisa, dua pengamatan pertama akan digunakan dalam perhitungan dan dua terakhir di . Untuk memperjelas mengapa identifikasi berasal dari perbedaan kelompok dari waktu ke waktu dan bukan dari penggerak Anda dapat memvisualisasikan ini dengan grafik sederhana. Misalkan perubahan dalam hasil benar-benar hanya karena perawatan dan bahwa ia memiliki efek kontemporer. Jika kita memiliki seseorang yang tinggal di kota yang dirawat setelah perawatan dimulai tetapi kemudian pindah ke kota kontrol, hasilnya harus kembali ke keadaan sebelum mereka dirawat. Ini ditunjukkan dalam grafik bergaya di bawah ini.E(yist|s=1,t=1) E(yist|s=0,t=1)
Anda mungkin masih ingin berpikir tentang penggerak untuk alasan lain. Misalnya, jika pengobatan memiliki efek yang bertahan lama (yaitu masih mempengaruhi hasil meskipun individu telah pindah)
sumber
Jawaban singkatnya adalah bahwa menggunakan efek tetap pada unit atau pada tingkat grup yang diperlakukan tidak mengubah estimasi, hanya inferensi. Biasanya, menggunakan unit fixed-effect akan menyerap lebih banyak variasi, dan karenanya Anda akan memiliki kesalahan standar yang lebih kecil.
Apakah unit berada di grup agregat yang sama tidak mengubah hasil ini (itu hanya mengubah cara Anda menentukan level grup yang Anda rawat , dan fakta bahwa Anda memerlukan panel alih-alih bagian-silang berulang).
Perhatikan bahwa kesetaraan hanya berlaku ketika tidak ada kovariat X. Segera setelah Anda memiliki Xs, hasilnya berbeda apakah Anda menggunakan efek tetap unit atau grup.
Contoh di bawah membandingkan 3 estimator, dalam dua kasus, dengan dan tanpa X. Estimator adalah:
Kode:
sumber