3 pertanyaan terkait tentang estimator DDD (TD, triple-diff)

8

Dalam Analisis Ekonometrik Jeff Wooldridge (edisi ke-2), ia memperoleh ungkapan untuk penduga perbedaan-perbedaan-dalam-perbedaan (DDD) pada halaman 151 untuk kasus dua periode di mana negara B mengimplementasikan perubahan kebijakan perawatan kesehatan yang ditujukan untuk orang tua. .

Pertama, saya bingung mengapa persamaan (6.56) tidak memiliki suku keempat

(y¯SEBUAH,N,2-y¯SEBUAH,N,1),

yang akan sesuai dengan perubahan untuk hasil kesehatan rata-rata untuk orang tua (kelompok N) di negara-negara yang tidak mengubah kebijakan mereka (kelompok A).

Dia mengutip Gruber (1994) sebagai menggunakan metode ini, tetapi bacaan saya dari tabel 3 dalam makalah itu adalah bahwa itu adalah perbedaan dari dua DD, jadi Anda perlu istilah keempat untuk memiliki itu (jika tidak Anda mendapatkan bukannya hanya ).δ3+δ0δ3

Saya sudah memeriksa errata untuk pencetakan kedua, dan ini tidak muncul, jadi saya harus kehilangan sesuatu di sini. Itu juga muncul dalam catatan kuliah NBER 2007- nya dalam bentuk yang sama.


Pertanyaan kedua saya adalah bahwa dalam kasus dengan lebih dari dua periode waktu, JW menyarankan regresi yang mencakup:

  • set lengkap boneka untuk jenis negara (A atau B)
  • set lengkap boneka untuk kategori usia (E atau N)
  • boneka untuk semua periode waktu
  • interaksi berpasangan antara tiga sebelumnya
  • boneka kebijakan yang mengambil nilai 1 untuk grup dan periode waktu yang tunduk pada kebijakan, yang merupakan parameter kepentingan DDD

JW menulis "set penuh boneka" dan "semua periode waktu", tetapi saya tidak yakin bagaimana hal itu dapat dilakukan tanpa jatuh ke dalam perangkap variabel dummy. Tampaknya wajar untuk menjatuhkan negara tipe A dan non-lansia (kelompok N), tetapi katakan saya memiliki 10 periode waktu, dan pengobatan terjadi pada periode 5. Bagaimana seseorang memilih dummy waktu mana yang akan dijatuhkan untuk menghindari dummy? perangkap variabel? Pilihan ini tampaknya mengubah parameter DDD dan interpretasinya, tetapi saya tidak yakin apakah ada yang terbaik. Inilah pertanyaan lain di mana ada pilihan alami karena ada satu periode pra yang berfungsi sebagai baseline.


Akhirnya, apa sebenarnya asumsi identifikasi dengan DDD, analog dengan tren umum dengan DD biasa? Apakah ada cara untuk menguji / meningkatkannya dengan beberapa periode?

Dalam Mikro-Ekonometrika Myoung-jae Lee untuk Kebijakan, Program, dan Efek Perawatan , kondisi (diterjemahkan ke dalam contoh JW) terdaftar sebagai

δ3+E[kamu1,2-kamu0,1|E=1,B=1]-E[kamu0,2-kamu0,1|E=1,SEBUAH=1]-E[kamu0,2-kamu0,1|N=1,B=1]-E[kamu0,2-kamu0,1|N=-=1,SEBUAH=1],
mana subskrip pertama mengindeks hasil potensial (1 diperlakukan, 0 jika tidak) dan yang kedua adalah waktu (posting adalah 2, pra adalah 1). Saya menafsirkan ini dengan mengatakan bahwa selama perubahan dalam waktu yang tidak dapat diobservasi untuk orang tua di negara yang dirawat dibandingkan dengan orang tua di tempat lain adalah sama besarnya dengan jumlah yang sama untuk orang yang tidak lanjut usia, maka DDD mengidentifikasi efek yang benar. Ini tampaknya lebih lemah dari tren umum, yang akan cukup, tetapi tidak perlu untuk DDD. Apakah ini benar?
Dimitriy V. Masterov
sumber

Jawaban:

2
  1. Kamu benar. Dalam tayangan slide 2011 ini , persamaan (4), slide 6, menunjukkan istilah yang hilang. Seperti yang Anda sebutkan, interpretasi yang perlu diingat adalah bahwa perbedaan rangkap tiga adalah perbedaan antara dua perbedaan dalam perbedaan.
  2. Anda benar untuk menyebutkan bahwa estimasi mengharuskan Anda menghilangkan kategori referensi untuk waktu Anda, negara dan efek kelompok usia tetap (untuk menghindari collinearity). Namun, pilihan kategori referensi tidak menjadi masalah bagi penaksir istilah triple-difference. Perhatikan bahwa Anda dapat menulis secara langsung boneka palsu Anda sebagai interaksi antara periode waktu, negara bagian, dan kelompok umur, lihat persamaan dalam catatan kuliah Pischke (bagian bawah halaman 16).
  3. Salah satu cara untuk membingkai asumsi identifikasi adalah sebagai berikut. Dalam DID standar, Anda ingin dua kelompok Anda berevolusi dengan cara yang sama jika pengobatan tidak ada. Dalam tiga perbedaan, Anda ingin celah antara kondisi yang Anda perlakukan dan kondisi Anda untuk berkembang secara serupa dari waktu ke waktu untuk individu yang lebih tua dan lebih muda, dengan tidak adanya perawatan. Anda juga bisa membingkainya dengan beralih status dan grup umur. Cara Anda menguji secara empiris ini terlebih dahulu adalah dengan melihat tren sebelum pengobatan terjadi (jika Anda memiliki data sebelum itu terjadi). Dalam kasus DID, Anda hanya akan merencanakan rata-rata yang dirawat dan kontrol untuk setiap tahun sebelum perawatan. Dalam kasus perbedaan tiga, Anda bisa melakukan hal yang sama dengan empat garis atau, lebih mudahnya, Anda bisa memplot kesenjangan antara status yang dirawat dan yang dikontrol, untuk setiap kelompok umur dan tahun,
Roland
sumber
1.) Hanya untuk mengklarifikasi, saya percaya bahwa penghilangan itu disengaja. Istilah keempat harus dijatuhkan karena nilai yang diharapkan adalah nol. Dengan kata lain, mengapa negara yang tidak menerima pengobatan mengamati efek yang berbeda pada populasi lansia? 2.) Dapatkah ini dicapai dengan menggunakan tren waktu linier dan kemudian berinteraksi dengan variabel perlakuan dengan tren waktu linier? Apakah dummy periode waktu negara benar-benar diperlukan? 3.) Saya pikir Anda dapat menguji ini sama dengan bagaimana Anda menguji tren paralel. Tempatkan serangkaian variabel interaksi sebelumnya. Uji-t individual harus memberi Anda signifikansi.
JuliusBilly