Kecocokan skor kecenderungan dengan data panel

13

Saya memiliki satu set data longitudinal individu dan beberapa dari mereka harus menjalani perawatan dan yang lainnya tidak. Semua individu dalam sampel dari lahir sampai usia 18 dan pengobatan terjadi pada usia tertentu di antara rentang itu. Usia perawatan mungkin berbeda di setiap kasus. Dengan menggunakan pencocokan skor kecenderungan, saya ingin mencocokkan unit yang dirawat dan kontrol berpasangan dengan pencocokan tepat pada tahun kelahiran sehingga saya dapat melacak setiap pasangan dari tahun kelahiran mereka sampai usia 18 tahun. Semuanya ada sekitar 150 yang dirawat dan 4000 orang yang tidak diobati. Setelah pencocokan idenya adalah untuk menggunakan strategi perbedaan-dalam-perbedaan untuk memperkirakan efek dari perawatan.

Masalah yang saya hadapi saat ini adalah melakukan pencocokan dengan data panel. Saya menggunakan psmatch2perintah Stata dan saya cocok dengan karakteristik rumah tangga dan individu menggunakan pencocokan skor kecenderungan. Secara umum dengan data panel akan ada kecocokan optimal yang berbeda pada setiap umur. Sebagai contoh: jika A dirawat, B dan C adalah kontrol, dan semuanya lahir pada 1980, maka A dan B dapat dicocokkan pada 1980 pada usia 0 sedangkan A dan C dicocokkan pada 1981 pada usia 1 dan seterusnya. . Juga A dapat dicocokkan dengan nilai pra-perawatan sendiri dari tahun-tahun sebelumnya.

Untuk mengatasi masalah ini, saya mengambil rata-rata dari semua variabel yang bervariasi waktu sehingga pencocokan dapat mengidentifikasi individu yang rata-rata paling mirip selama durasi sampel dan saya melakukan pencocokan secara terpisah untuk setiap kelompok umur 0 hingga 18. Sayangnya ini masih cocok dengan unit kontrol yang berbeda untuk setiap unit yang dirawat per kelompok umur.

Jika seseorang bisa mengarahkan saya ke metode untuk melakukan pencocokan berpasangan dengan data panel di Stata ini akan sangat dihargai.

Andy
sumber

Jawaban:

9

Anda pada dasarnya harus membuat dataset format lebar dengan semua karakteristik yang relevan untuk prosedur pencocokan, melakukan pencocokan pada dataset cross-sectional ini, dan kemudian menggunakan ID untuk mengidentifikasi pasangan yang cocok dalam dataset panel. Berikut ini beberapa detail lainnya:

  1. Gunakan reshapeuntuk membuat dataset format lebar. Format variabel pra-perawatan dengan cara yang Anda inginkan untuk menggunakannya dalam prosedur yang cocok. Anda hanya dapat mengambil rata-rata variabel Anda jika Anda memiliki beberapa pengamatan untuk satu orang tetapi Anda juga dapat menemukan cara-cara lain (Anda juga dapat menyimpan banyak pengamatan dari variabel yang sama seperti health1, health2 dan menggunakan semuanya dalam pencocokan ). Tujuannya adalah untuk memiliki dataset dengan satu pengamatan per individu .

  2. Menggunakan dataset ini, lakukan prosedur pencocokan dengan psmatch2.

  3. Gabungkan informasi tentang kasus yang cocok dengan dataset asli. Jatuhkan case yang tidak cocok dll. Saya tidak yakin tentang detailnya di sini karena saya tidak benar-benar tahu stata dan psmatch2tapi saya pikir Anda mendapatkan idenya.

Dengan menggunakan langkah-langkah ini, Anda dapat mencocokkan kasus berdasarkan semua informasi pra-perawatan dan Anda hanya memiliki satu kecocokan per unit perawatan.

greg
sumber
3
Saya benar-benar tidak tahu mengapa posting ini tidak dipilih karena jawaban ini sebenarnya membantu. Saya akan memilihnya lagi. Terima kasih greg!
Andy
5

Tidak ada cara untuk melakukan itu di Stata atau perangkat lunak lain yang saya ketahui.

Jika Anda mencoba untuk menambal penaksir yang bias bias dengan teknik data panel, berikut adalah satu pendekatan yang mungkin berhasil. Jika Anda dapat mengasumsikan bahwa pencocokan memperhatikan beberapa, tetapi tidak semua bias seleksi, tetapi bias sebagian besar tetap konstan dari waktu ke waktu, Anda dapat menghapus bagian bias waktu dengan membangun estimasi pencocokan terpisah di setiap periode dan mengambil perbedaan.

ttY0

E[Y0t|X,D=1]E[Y0t|X,D=0]=E[Y0t|X,D=1]E[Y0t|X,D=0]=Bias,
ΔtM=ΔTT+BiasΔtM=BiasΔtMΔtM=ΔTT

Heckman, Ichimura, Smith dan Todd 1998 Econometrica dan Eichler dan Lechner 2002 makalah Ekonomi Buruh adalah contoh dari pendekatan ini. Di sisi lain, 150 pengamatan yang dirawat mungkin tidak cukup untuk pendekatan ini untuk bekerja.

Dimitriy V. Masterov
sumber
1
Itu harus mungkin untuk mencocokkan individu berpasangan untuk data panel karena dua makalah ini ( paper1 , paper2 ) melakukannya juga. Sayangnya penulis tidak menyatakan dengan tepat bagaimana mereka melakukannya. Ide yang Anda gambarkan dengan Heckman et al (1998) adalah persis alasan untuk menggunakan Diff-in-Diff setelah pencocokan berpasangan.
Andy
Tidak jelas bagi saya bahwa mereka melakukan pencocokan panel, tetapi Anda benar bahwa prosedurnya tidak jelas. Para penulis memang menulis pscore, yang menandakan kesediaan tertentu untuk membantu orang lain. Mungkin email ke mereka akan menjelaskan hal-hal. Laporkan apa yang mereka katakan. Itu pertanyaan penting.
Dimitriy V. Masterov
0

Langkah:

  1. Seperti yang telah disebutkan secara rinci oleh Greg, Anda dapat menggunakan dataset cross-sectional, baik pada sarana pra-perawatan atau pada periode pra-perawatan khusus untuk menghasilkan pencocokan.

  2. Menggunakan seluruh panel Anda menetapkan variabel indikator untuk
    a. diperlakukan Individual
    b. diperlakukanPeriod, yang terakhir sama dengan nol segera setelah pengobatan terjadi untuk Individu yang diobati.

    Karena titik waktu di mana perubahan diperlakukanPeriod dari 0 ke 1 bervariasi antar individu dan tidak pernah berubah menjadi 1 untuk yang tidak diobati, Anda harus menetapkan titik awal yang sama dari pertandingan yang diperlakukan ke pertandingan yang tidak diobati. Ini intuitif tetapi saya masih ingin melihat referensi yang bagus yang membenarkan pendekatan ini yang belum saya temukan sejauh ini.

Pengaturan regresi adalah:

depvar = treatedIndvidual + treatedPeriod  + treatedIndvidual*treatedPeriod + controls

di mana istilah interaksi memberi Anda efek pengobatan.

Matthias
sumber
-2

Apakah Anda mempertimbangkan untuk menggunakan perintah nnmatch ?

Saya menggunakan perintah ini dan ini cukup komprehensif. Itu tidak memperhitungkan algoritma pencocokan yang berbeda dan juga kasus, di mana skor kecenderungan adalah sama untuk beberapa individu kelompok kontrol. Tentu saja, penanganan kasus ini tergantung pada algoritma yang cocok, jika Anda mengambil k-tetangga terdekat atau kernel atau apa pun.

Stat Tistician
sumber
Dalam artikel yang Anda referensikan, saya tidak melihat menyebutkan data panel. Sudahkah Anda menggunakannya untuk data panel? Jika demikian, harap spesifik dan berikan beberapa kode untuk menjawab pertanyaan OP.
Metrik
Pencocokan tepat lebih mudah tetapi nnmatch keseluruhan lebih rumit karena tidak menyimpan ID yang cocok di dalam kumpulan data saat ini tetapi dalam yang terpisah. Saya akan berakhir dengan satu set data untuk setiap kelompok umur yang perlu digabung dengan data asli. Penggabungan dalam kasus ini tidak berfungsi karena karakteristik yang cocok tidak secara unik mengidentifikasi individu dalam data asli. Jadi sayangnya ini tidak memberikan solusi.
Andy