Menentukan perbedaan dalam model perbedaan dengan beberapa periode waktu

20

Ketika saya memperkirakan perbedaan dalam model perbedaan dengan dua periode waktu, model regresi yang setara akan

Sebuah. Yist=α+γsTreatment+λdt+δ(Treatmentdt)+ϵist

  • di mana adalah boneka yang sama dengan 1 jika observasi dari kelompok perlakuanTreatment
  • dan adalah boneka yang sama dengan 1 pada periode waktu setelah perawatan terjadid

Dengan demikian persamaan mengambil nilai-nilai berikut.

  • Kelompok kontrol, sebelum perawatan:α
  • Kelompok kontrol, setelah perawatan:α+λ
  • Kelompok pengobatan, sebelum perawatan:α+γ
  • Kelompok pengobatan, setelah perawatan: α+γ+λ+δ

Oleh karena itu, dalam model dua periode perbedaan estimasi perbedaan adalahδ .

Tapi apa yang terjadi tentang dt jika saya memiliki lebih dari satu pra dan masa pengobatan pasca? Apakah saya masih menggunakan boneka yang menunjukkan apakah satu tahun sebelum atau setelah perawatan?

Atau apakah saya menambahkan tahun boneka bukan tanpa menentukan apakah setiap tahun termasuk dalam periode pra atau pasca perawatan? Seperti ini:

b. Yist=α+γsTreatment+yeardummy+δ(Treatmentdt)+ϵist

Atau bisa saya mencakup baik (yaitu )?yeardummy+λdt

c. Yist=α+γsTreatment+yeardummy+λdt+δ(Treatmentdt)+ϵist

Sebagai kesimpulan, bagaimana cara menentukan perbedaan dalam model perbedaan dengan beberapa periode waktu (a, b atau c)?

Tom
sumber
1
Anda biasanya menggunakan model b. Perhatikan bahwa dalam model c, akan sempurna collinear dengan dummies tahun, sehingga model yang tidak dapat diperkirakan. dt
standard_error
Akan lebih bagus jika Anda bisa menjelaskan mengapa b digunakan secara umum. Mungkin memberikan beberapa referensi, atau hanya memberikan penjelasan 2 kalimat.
mpiktas
dan dalam model b. Bisakah Anda menambahkan variabel kontinu untuk tahun bukan boneka? Bagaimana perbedaan interpretasi koefisien dalam kasus-kasus itu?

Jawaban:

19

Cara khas untuk memperkirakan perbedaan dalam model perbedaan dengan lebih dari dua periode waktu adalah solusi yang Anda usulkan b). Menjaga notasi Anda, Anda akan mundur di mana D tPengobatan sd t yaitu dummy variabel yang sama dengan satu untuk unit perawatan s

Yist=α+γs(Treatments)+λ(year dummyt)+δDst+ϵist
DtTreatmentsdtsdalam periode pasca-pengobatan ( ) dan nol sebaliknya. Perhatikan bahwa ini adalah formulasi yang lebih umum dari perbedaan dalam regresi perbedaan yang memungkinkan untuk penentuan waktu perawatan yang berbeda untuk unit yang dirawat berbeda.dt=1

Seperti yang ditunjukkan dengan benar dalam komentar solusi yang Anda usulkan c) tidak berhasil karena kolinearitas dengan waktu boneka dan boneka untuk periode pasca perawatan. Namun, varian yang sedikit ini ternyata adalah pemeriksaan ketahanan. Mari dan γ s 1 menjadi dua set variabel dummy untuk setiap unit kontrol s 0 dan setiap unit diperlakukan s 1 , masing-masing, kemudian berinteraksi dengan dummies untuk unit diperlakukan dengan variabel waktu t dan regresi Y i s t = γ s 0 + γ s 1 tγs0γs1s0s1t termasuk waktu tren unit khusus γ s 1 t . Ketika Anda memasukkan tren waktu khusus unit ini dan perbedaan dalam koefisien perbedaan δ tidak berubah secara signifikan, Anda dapat lebih percaya diri tentang hasil Anda. Kalau tidak, Anda mungkin bertanya-tanya apakah efek pengobatan Anda telah menyerap perbedaan antara unit yang dirawat karena tren waktu yang mendasarinya (dapat terjadi ketika kebijakan dimulai pada titik waktu yang berbeda).

Yist=γs0+γs1t+λ(year dummyt)+δDst+ϵist
γs1tδ

Contoh yang dikutip dalam Angrist dan Pischke (2009) Mostly Harmless Econometrics adalah studi kebijakan pasar tenaga kerja oleh Besley and Burgess (2004) . Dalam makalah mereka itu terjadi bahwa dimasukkannya tren waktu spesifik negara membunuh perkiraan efek pengobatan. Perhatikan bahwa untuk pemeriksaan ketahanan ini Anda membutuhkan lebih dari 3 periode waktu.

Andy
sumber
Tindak lanjut sejak saya mencoba untuk memutuskan apakah menerapkan ini dengan beberapa data administrasi sudah tepat: Apakah Anda mengatakan pendekatan DD lebih valid daripada desain CITS jika hanya ada 4 titik waktu (2 pra dan 2 posting) dalam model? Juga, jika saya memiliki banyak kohort dalam gelombang data, apakah ini harus diperiksa secara terpisah atau dalam model terpadu? Terima kasih.
bfoste01
@Andy: Bisakah Anda jelaskan, apa yang Anda maksud dengan tren waktu s0, s1, dan unit-spesifik? Dengan asumsi saya memiliki dua surat kabar (WPT dan NYT) dan WPT adalah grup treatment saya, yang mana dari mereka akan s0 dan s1?
user3683131
1
Apakah saya benar dalam berpikir bahwa analisis ini membandingkan rata-rata pra dan pasca perawatan dan tidak memperhitungkan tren sekuler? yaitu jika d_t = 0 untuk semua periode waktu sebelum titik switch, dan d_t = 1 untuk semua periode waktu setelah, maka analisis ini pada dasarnya sama dengan dua periode waktu satu, kecuali rata-rata diambil dari semua sebelum / sesudah waktu titik. Adakah tren waktu dalam hasil sebelum / sesudah penggantian pengobatan diabaikan? Saya mencoba memutuskan apakah model DID benar untuk analisis yang saya rencanakan untuk dilakukan.
AP30
0

γ1s

Angrist dan Pischke (2009) merekomendasikan pendekatan ini pada halaman 238 dalam Mostly Harmless Econometrics . Perbedaan notasi dapat menyebabkan kebingungan. Spesifikasi reproduksi 5.2.7:

yist=γ0s+γ1st+λt+δDst+Xistβ+εist,

γ0ssγ1st

ys,t=sStates+tYeart+sStatesTimet+δDs,t+εs,t,

Ds,tstTimet

Tren waktu linier khusus unit juga dibahas di pos lain (lihat di bawah):

Bagaimana cara menghitung penempatan program endogen?

Singkatnya, Anda ingin berinteraksi semua unit (grup) boneka dengan variabel tren waktu kontinu.

Makalah karya Justin Wolfers di bawah ini untuk referensi Anda:

https://users.nber.org/~jwolfers/papers/Divorce(AER).pdf

Tom
sumber