Membuktikan Teorema TERLAMBAT dari Angrist dan Imbens 1994

8

Asumsikan kita memiliki instrumen biner Zi yang dapat digunakan untuk memperkirakan efek dari variabel endogen Dipada hasil . Misalkan instrumen memiliki tahap pertama yang signifikan, itu ditetapkan secara acak, memenuhi batasan eksklusi, dan memenuhi monotonitas sebagaimana diuraikan dalam Angrist dan Imbens (1994). http://www.jstor.org/discover/10.2307/2951620?uid=3738032&uid=2&uid=4&sid=21104754800073Yi

Mereka menyatakan bahwa probabilitas menjadi kompiler ( ) adalah dan perbedaan dalam hasil potensial untuk subpopulasi adalah Ci

Pr(Ci)=Pr(Di=1|Zi=1)Pr(Di=1Zi=0)
E(Yi1Yi0|Ci)=E(Yi|Zi=1)E(Yi|Zi=0)E(Di|Zi=1)E(Di|Zi=0)

Adakah yang bisa menjelaskan bagaimana mereka mendapatkan dua ekspresi ini dan yang lebih penting bagaimana mereka menggabungkannya? Saya mencoba memahami ini dari artikel jurnal mereka tetapi saya tidak dapat memahaminya. Bantuan apa pun akan sangat dihargai.

pengguna44903
sumber

Jawaban:

5

Untuk bagian pertama Anda menyatakan bahwa Anda memiliki instrumen "valid". Ini menyiratkan untuk perawatan biner dan instrumen ituCov(Di,Zi)0 setara dengan P(Di=1|Zi=1)P(Di=1|Zi=0), yaitu instrumen memiliki efek pada apakah perawatan dipilih atau tidak. Pengamatan ini yang juga harus dinyatakan dalam makalah Angrist dan Imbens adalah kunci untuk sisa bukti mereka. Untuk tahap pertama mereka menganggap ituP(Di=1|Zi=1)>P(Di=1|Zi=0), artinya jumlah penyesuai (Ci) lebih besar dari defiers (Fi).

Menggunakan batasan pengecualian (untuk setiap z {0;1} kami memilikinya Yiz=Yi0z=Yi1z, yaitu instrumen tidak memiliki efek langsung pada hasil) Anda dapat menulis perbedaan dalam bagian penyesuai dan penyerang dalam populasi sebagai mana langkah kedua menggunakan independensi untuk menyingkirkan pengkondisian pada

P(Di=1|Zi=1)P(Di=1|Zi=0)=P(Di1=1|Zi=1)P(Di0=1|Zi=0)=P(Di1=1)P(Di0=0)=[P(Di1=1,Di0=0)+P(Di1=1,Di0=1)][P(Di1=0,Di0=1)+P(Di1=1,Di0=1)]=P(Ci)P(Fi)
Zi karena hasil potensial tidak tergantung pada instrumen. Langkah ketiga menggunakan hukum probabilitas total. Pada langkah terakhir Anda hanya perlu menggunakan monotonisitas yang pada dasarnya mengasumsikan bahwa penangkal tidak ada,P(Fi)=0 dan Anda dapatkan
P(Ci)=P(Di=1|Zi=1)P(Di=1|Zi=0).
Ini akan menjadi koefisien tahap pertama Anda dalam regresi 2SLS. Asumsi monotonisitas sangat penting untuk ini dan orang harus berpikir keras tentang kemungkinan alasan mengapa hal itu dilanggar (namun, monotonitas dapat dilonggarkan, lihat misalnya de Chaisemartin (2012) “Yang Anda butuhkan adalah TERLAMBAT” ).

Bagian kedua dari buktinya mengikuti jalur yang sama. Untuk ini, Anda harus ingat bahwa status perawatan yang diamati adalah karena Anda tidak dapat mengamati kedua hasil potensial untuk individu yang sama. Dengan cara ini Anda dapat menghubungkan hasil yang diamati dengan hasil potensial, status perawatan, dan instrumen sebagai

Di=ZiDi1+(1Zi)Di0
Yi=(1Zi)(1Di)Yi00+Zi(1Di)Yi10+(1Zi)DiYi01+ZiDiYi11
Untuk bagian kedua dari bukti ambil perbedaan dalam hasil yang diharapkan dengan instrumen diaktifkan dan diaktifkan, dan gunakan representasi sebelumnya dari hasil yang diamati dan pembatasan pengecualian dalam langkah pertama untuk mendapatkan:
E(Yi|Zi=1)E(Yi|Zi=0)=E(Yi1Di+Yi0(1Di)|Zi=0)E(Yi1Di+Yi0(1Di)|Zi=1)=E(Yi1Di1+Yi0(1Di1)|Zi=1)E(Yi1Di0+Yi0(1Di0)|Zi=0)=E(Yi1Di1+Yi0(1Di1))E(Yi1Di0+Yi0(1Di0))=E((Yi1Yi0)(Di1Di0))=E(Yi1Yi0|Di1Di0=1)P(Di1Di0=1)E(Yi1Yi0|Di1Di0=1)P(Di1Di0=1)=E(Yi1Yi0|Ci)P(Ci)E(Yi1Yi0|Fi)P(Fi)=E(Yi1Yi0|Ci)P(Ci)

Sekarang ini cukup banyak pekerjaan tetapi tidak terlalu buruk jika Anda tahu langkah-langkah yang perlu Anda ambil. Untuk lini kedua gunakan lagi pembatasan eksklusi untuk menuliskan status pengobatan potensial. Di baris ketiga gunakan independensi untuk menyingkirkan pengkondisian pada seperti sebelumnya. Pada baris keempat, Anda hanya memasukkan faktor. Baris kelima menggunakan hukum ekspektasi berulang. Baris terakhir muncul karena asumsi monotonisitas, yaitu . Maka Anda hanya perlu membagi sebagai langkah terakhir dan Anda tiba di ZiP(Fi)=0

E(Yi1Yi0|Ci)=E(Yi|Zi=1)E(Yi|Zi=0)P(Ci)=E(Yi|Zi=1)E(Yi|Zi=0)P(Di=1|Zi=1)P(Di=1|Zi=0)=E(Yi|Zi=1)E(Yi|Zi=0)E(Di|Zi=1)E(Di|Zi=0)
karena dan adalah biner. Ini harus menunjukkan bagaimana Anda menggabungkan dua bukti dan bagaimana mereka sampai pada ekspresi akhir.DiZi
Andy
sumber
5

Ada empat tipe orang:

  1. Never Takers (NT): untuk kedua nilai ZD=0
  2. Defiers (DF): saat dan saatD=0Z=1D=1Z=0
  3. Compliers (C): saat dan saatD=1Z=1D=0Z=0
  4. Selalu Takers (AT): untuk kedua nilai .D=1Z

Rumus untuk penduga Wald adalah:

ΔIV=E(Y|Z=1)E(Y|Z=0)Pr(D=1|Z=1)Pr(D=1|Z=0)

Dengan menggunakan 4 grup kami dan aturan dasar probabilitas, kami dapat menulis ulang dua angka pembilang sebagai: dan

E(Y|Z=1)=E(Y1|AT)Pr(AT)+E(Y1|C)Pr(C)+E(Y0|DF)Pr(DF)+E(Y0|NT)Pr(NT)
E(Y|Z=0)=E(Y1|AT)Pr(AT)+E(Y0|C)Pr(C)+E(Y1|DF)Pr(DF)+E(Y0|NT)Pr(NT)

Dua istilah penyebut adalah: dan

Pr(D=1|Z=1)=Pr(D=1|Z=1,AT)Pr(AT)+Pr(D=1|Z=1,C)Pr(C)=Pr(AT)+Pr(C)
Pr(D=1|Z=0)=Pr(D=1|Z=0,AT)Pr(AT)+Pr(D=1|Z=0,DF)Pr(DF)=Pr(AT)+Pr(DF)

Yang pertama sesuai dengan ekspresi pertama Anda.

Kembali ke formula Wald dan memasukkannya ke dalam, kita melihat bahwa beberapa istilah ini dibatalkan dalam pengurangan, meninggalkan

ΔIV=[E(Y1|C)Pr(C)+E(Y0|D)Pr(D)][E(Y0|C)Pr(C)+E(Y1|DF)Pr(DF)]Pr(C)Pr(DF).
 Ini menghasilkan beberapa wawasan. Estimator Wald IV adalah rata-rata tertimbang dari efek perawatan pada penyesuai dan negatif dari efek perawatan pada defiers.

Sekarang kita membuat dua asumsi. Pertama, kami menganggap monotonisitas, sehingga instrumen hanya dapat meningkatkan atau mengurangi kemungkinan partisipasi. Ini berarti . Asumsi monotonisitas sama dengan asumsi model fungsi indeks untuk perawatan. Asumsi kedua adalah bahwa ada beberapa penyesuai, yaitu mengatakan bahwa . Perilaku beberapa individu harus diubah oleh instrumen. Ini harus menjadi kasus jika instrumen tersebut relevan. Dua asumsi ini menghasilkanPr(DF)=0Pr(C)>0

ΔIV=E(Y1|C)Pr(C)E(Y0|C)Pr(C)Pr(C)=E(Y1|C)E(Y0|C)=LATE.

Dimitriy V. Masterov
sumber
+1, saya pikir dua jawaban saling melengkapi dengan sangat baik. Yang ini menunjukkan lebih banyak intuisi penduga Wald dan dari mana asumsinya berasal daripada hanya menggunakannya secara teknis murni
Andy