Membuktikan Teorema TERLAMBAT dari Angrist dan Imbens 1994

Asumsikan kita memiliki instrumen biner $Z_i$ yang dapat digunakan untuk memperkirakan efek dari variabel endogen $D_i$ pada hasil . Misalkan instrumen memiliki tahap pertama yang signifikan, itu ditetapkan secara acak, memenuhi batasan eksklusi, dan memenuhi monotonitas sebagaimana diuraikan dalam Angrist dan Imbens (1994). http://www.jstor.org/discover/10.2307/2951620?uid=3738032&uid=2&uid=4&sid=21104754800073 $Y_i$

Mereka menyatakan bahwa probabilitas menjadi kompiler ( ) adalah dan perbedaan dalam hasil potensial untuk subpopulasi adalah $C_i$

Pr (C_{i}) = Pr (D_{i} = 1 | Z_{i} = 1) - Pr (D_{i} = 1 - Z_{i} = 0)

$\text{Pr}(C_i) = \text{Pr}(D_i = 1|Z_i = 1) - \text{Pr}(D_i = 1 - Z_i = 0)$

E (Y_{i 1} - Y_{i 0} | C_{i}) = \frac{E (Y_{i} | Z_{i} = 1) - E (Y_{i} | Z_{i} = 0)}{E (D_{i} | Z_{i} = 1) - E (D_{i} | Z_{i} = 0)}

$E(Y_{i1} - Y_{i0}|C_i) = \frac{E(Y_i|Z_i=1)-E(Y_i|Z_i=0)}{E(D_i|Z_i=1)-E(D_i|Z_i=0)}$

Adakah yang bisa menjelaskan bagaimana mereka mendapatkan dua ekspresi ini dan yang lebih penting bagaimana mereka menggabungkannya? Saya mencoba memahami ini dari artikel jurnal mereka tetapi saya tidak dapat memahaminya. Bantuan apa pun akan sangat dihargai.

mathematical-statistics econometrics proof instrumental-variables pengguna44903
sumber

Jawaban:

Untuk bagian pertama Anda menyatakan bahwa Anda memiliki instrumen "valid". Ini menyiratkan untuk perawatan biner dan instrumen itu $Cov(D_i,Z_i) \neq 0$ setara dengan $P(D_i = 1|Z_i = 1) \neq P(D_i = 1|Z_i = 0)$ , yaitu instrumen memiliki efek pada apakah perawatan dipilih atau tidak. Pengamatan ini yang juga harus dinyatakan dalam makalah Angrist dan Imbens adalah kunci untuk sisa bukti mereka. Untuk tahap pertama mereka menganggap itu $P(D_i = 1|Z_i = 1) > P(D_i = 1|Z_i = 0)$ , artinya jumlah penyesuai ( $C_i)$ lebih besar dari defiers ( $F_i$ ).

Menggunakan batasan pengecualian (untuk setiap $z \in$ { $0;1$ } kami memilikinya $Y_{iz} = Y_{i0z} = Y_{i1z}$ , yaitu instrumen tidak memiliki efek langsung pada hasil) Anda dapat menulis perbedaan dalam bagian penyesuai dan penyerang dalam populasi sebagai mana langkah kedua menggunakan independensi untuk menyingkirkan pengkondisian pada

\begin{aligned} P (D_{i} = 1 | Z_{i} = 1) - P (D_{i} = 1 | Z_{i} = 0) & = P (D_{i 1} = 1 | Z_{i} = 1) - P (D_{i 0} = 1 | Z_{i} = 0) \\ = P (D_{i 1} = 1) - P (D_{i 0} = 0) \\ = [P (D_{i 1} = 1, D_{i 0} = 0) + P (D_{i 1} = 1, D_{i 0} = 1)] - [P (D_{i 1} = 0, D_{i 0} = 1) + P (D_{i 1} = 1, D_{i 0} = 1)] \\ = P (C_{i}) - P (F_{i}) \end{aligned}

$\begin{align} P(D_i = 1|Z_i = 1) - P(D_i = 1|Z_i = 0) &= P(D_{i1} = 1|Z_i = 1) - P(D_{i0} = 1|Z_i = 0) \newline &= P(D_{i1} = 1) - P(D_{i0} = 0) \newline &= \left[ P(D_{i1} = 1, D_{i0} = 0) + P(D_{i1} = 1, D_{i0} = 1) \right] - \left[ P(D_{i1} = 0, D_{i0} = 1) + P(D_{i1} = 1, D_{i0} = 1) \right] \newline &= P(C_i) – P(F_i) \end{align}$

Z_{i}

$Z_i$ karena hasil potensial tidak tergantung pada instrumen. Langkah ketiga menggunakan hukum probabilitas total. Pada langkah terakhir Anda hanya perlu menggunakan monotonisitas yang pada dasarnya mengasumsikan bahwa penangkal tidak ada,

P (F_{i}) = 0

$P(F_i) = 0$ dan Anda dapatkan

P (C_{i}) = P (D_{i} = 1 | Z_{i} = 1) - P (D_{i} = 1 | Z_{i} = 0) .

$P(C_i) = P(D_i = 1|Z_i = 1) - P(D_i = 1|Z_i = 0).$ Ini akan menjadi koefisien tahap pertama Anda dalam regresi 2SLS. Asumsi monotonisitas sangat penting untuk ini dan orang harus berpikir keras tentang kemungkinan alasan mengapa hal itu dilanggar (namun, monotonitas dapat dilonggarkan, lihat misalnya de Chaisemartin (2012) “Yang Anda butuhkan adalah TERLAMBAT” ).

Bagian kedua dari buktinya mengikuti jalur yang sama. Untuk ini, Anda harus ingat bahwa status perawatan yang diamati adalah karena Anda tidak dapat mengamati kedua hasil potensial untuk individu yang sama. Dengan cara ini Anda dapat menghubungkan hasil yang diamati dengan hasil potensial, status perawatan, dan instrumen sebagai

D_{i} = Z_{i} D_{i 1} + (1 - Z_{i}) D_{i 0}

$D_i = Z_iD_{i1} + (1-Z_i)D_{i0}$

Y_{i} = (1 - Z_{i}) (1 - D_{i}) Y_{i 00} + Z_{i} (1 - D_{i}) Y_{i 10} + (1 - Z_{i}) D_{i} Y_{i 01} + Z_{i} D_{i} Y_{i 11}

$Y_i = (1-Z_i)(1-D_i)Y_{i00} + Z_i(1-D_i)Y_{i10} + (1-Z_i)D_iY_{i01} + Z_iD_iY_{i11}$ Untuk bagian kedua dari bukti ambil perbedaan dalam hasil yang diharapkan dengan instrumen diaktifkan dan diaktifkan, dan gunakan representasi sebelumnya dari hasil yang diamati dan pembatasan pengecualian dalam langkah pertama untuk mendapatkan:

\begin{aligned} E (Y_{i} | Z_{i} = 1) - E (Y_{i} | Z_{i} = 0) & = E (Y_{i 1} D_{i} + Y_{i 0} (1 - D_{i}) | Z_{i} = 0) \\ - E (Y_{i 1} D_{i} + Y_{i 0} (1 - D_{i}) | Z_{i} = 1) \\ = E (Y_{i 1} D_{i 1} + Y_{i 0} (1 - D_{i 1}) | Z_{i} = 1) \\ - E (Y_{i 1} D_{i 0} + Y_{i 0} (1 - D_{i 0}) | Z_{i} = 0) \\ = E (Y_{i 1} D_{i 1} + Y_{i 0} (1 - D_{i 1})) \\ - E (Y_{i 1} D_{i 0} + Y_{i 0} (1 - D_{i 0})) \\ = E ((Y_{i 1} - Y_{i 0}) (D_{i 1} - D_{i 0})) \\ = E (Y_{i 1} - Y_{i 0} | D_{i 1} - D_{i 0} = 1) P (D_{i 1} - D_{i 0} = 1) \\ - E (Y_{i 1} - Y_{i 0} | D_{i 1} - D_{i 0} = - 1) P (D_{i 1} - D_{i 0} = - 1) \\ = E (Y_{i 1} - Y_{i 0} | C_{i}) P (C_{i}) - E (Y_{i 1} - Y_{i 0} | F_{i}) P (F_{i}) \\ = E (Y_{i 1} - Y_{i 0} | C_{i}) P (C_{i}) \end{aligned}

$\begin{align} E(Y_i|Z_i = 1) – E(Y_i|Z_i=0) &= E(Y_{i1}D_i + Y_{i0}(1-D_i)|Z_i=0) \newline &- E(Y_{i1}D_i + Y_{i0}(1-D_i)|Z_i=1)\newline &= E(Y_{i1}D_{i1} + Y_{i0}(1-D_{i1})|Z_i=1) \newline &- E(Y_{i1}D_{i0} + Y_{i0}(1-D_{i0})|Z_i=0) \newline &= E(Y_{i1}D_{i1} + Y_{i0}(1-D_{i1})) \newline &- E(Y_{i1}D_{i0} + Y_{i0}(1-D_{i0})) \newline &= E((Y_{i1}-Y_{i0})(D_{i1}-D_{i0})) \newline &= E(Y_{i1}-Y_{i0}|D_{i1}-D_{i0}=1)P(D_{i1}-D_{i0} = 1) \newline &- E(Y_{i1}-Y_{i0}|D_{i1}-D_{i0}=-1)P(D_{i1}-D_{i0} = -1) \newline &= E(Y_{i1}-Y_{i0}|C_i)P(C_i) - E(Y_{i1}-Y_{i0}|F_i)P(F_i) \newline &= E(Y_{i1}-Y_{i0}|C_i)P(C_i) \end{align}$

Sekarang ini cukup banyak pekerjaan tetapi tidak terlalu buruk jika Anda tahu langkah-langkah yang perlu Anda ambil. Untuk lini kedua gunakan lagi pembatasan eksklusi untuk menuliskan status pengobatan potensial. Di baris ketiga gunakan independensi untuk menyingkirkan pengkondisian pada seperti sebelumnya. Pada baris keempat, Anda hanya memasukkan faktor. Baris kelima menggunakan hukum ekspektasi berulang. Baris terakhir muncul karena asumsi monotonisitas, yaitu . Maka Anda hanya perlu membagi sebagai langkah terakhir dan Anda tiba di $Z_i$ $P(F_i)=0$

\begin{aligned} E (Y_{i 1} - Y_{i 0} | C_{i}) & = \frac{E (Y_{i} | Z_{i} = 1) - E (Y_{i} | Z_{i} = 0)}{P (C_{i})} \\ = \frac{E (Y_{i} | Z_{i} = 1) - E (Y_{i} | Z_{i} = 0)}{P (D_{i} = 1 | Z_{i} = 1) - P (D_{i} = 1 | Z_{i} = 0)} \\ = \frac{E (Y_{i} | Z_{i} = 1) - E (Y_{i} | Z_{i} = 0)}{E (D_{i} | Z_{i} = 1) - E (D_{i} | Z_{i} = 0)} \end{aligned}

$\begin{align} E(Y_{i1}-Y_{i0}|C_i) &= \frac{E(Y_i|Z_i = 1) – E(Y_i|Z_i=0)}{P(C_i)} \newline &= \frac{E(Y_i|Z_i = 1) – E(Y_i|Z_i=0)}{P(D_i = 1|Z_i = 1) - P(D_i = 1|Z_i = 0)} \newline &= \frac{E(Y_i|Z_i = 1) – E(Y_i|Z_i=0)}{E(D_i|Z_i = 1) - E(D_i|Z_i = 0)} \end{align}$ karena dan adalah biner. Ini harus menunjukkan bagaimana Anda menggabungkan dua bukti dan bagaimana mereka sampai pada ekspresi akhir.

D_{i}

$D_i$

Z_{i}

$Z_i$

Andy
sumber

Ada empat tipe orang:

Never Takers (NT): untuk kedua nilai Z $D = 0$
Defiers (DF): saat dan saat $D=0$ $Z =1$ $D=1$ $Z =0$
Compliers (C): saat dan saat $D=1$ $Z =1$ $D=0$ $Z =0$
Selalu Takers (AT): untuk kedua nilai . $D =1$ $Z$

Rumus untuk penduga Wald adalah:

Δ_{I V} = \frac{E (Y | Z = 1) - E (Y | Z = 0)}{P r (D = 1 | Z = 1) - P r (D = 1 | Z = 0)}

$\Delta_{IV} = \frac{E(Y|Z=1)−E(Y|Z=0)}{Pr(D=1|Z =1)−Pr(D=1|Z =0)}$

Dengan menggunakan 4 grup kami dan aturan dasar probabilitas, kami dapat menulis ulang dua angka pembilang sebagai: dan

E (Y | Z = 1) = E (Y_{1} | A T) \cdot P r (A T) + E (Y_{1} | C) \cdot P r (C) + E (Y_{0} | D F) \cdot P r (D F) + E (Y_{0} | N T) \cdot P r (N T)

E (Y | Z = 0) = E (Y_{1} | A T) \cdot P r (A T) + E (Y_{0} | C) \cdot P r (C) + E (Y_{1} | D F) \cdot P r (D F) + E (Y_{0} | N T) \cdot P r (N T)

Dua istilah penyebut adalah: dan

P r (D = 1 | Z = 1) = P r (D = 1 | Z = 1, A T) \cdot P r (A T) + P r (D = 1 | Z = 1, C) \cdot P r (C) = P r (A T) + P r (C)

$Pr(D=1|Z =1)=Pr(D=1|Z =1,AT) \cdot Pr(AT)+Pr(D=1|Z =1,C) \cdot Pr(C) \\ =Pr(AT)+Pr(C)$

P r (D = 1 | Z = 0) = P r (D = 1 | Z = 0, A T) \cdot P r (A T) + P r (D = 1 | Z = 0, D F) \cdot P r (D F) = P r (A T) + P r (D F)

$Pr(D=1|Z =0)=Pr(D=1|Z = 0,AT) \cdot Pr(AT)+Pr(D=1|Z =0,DF) \cdot Pr(DF) \\ =Pr(AT)+Pr(DF)$

Yang pertama sesuai dengan ekspresi pertama Anda.

Kembali ke formula Wald dan memasukkannya ke dalam, kita melihat bahwa beberapa istilah ini dibatalkan dalam pengurangan, meninggalkan

Δ_{I V} = \frac{[E (Y_{1} | C) \cdot P r (C) + E (Y_{0} | D) \cdot P r (D)] - [E (Y_{0} | C) \cdot P r (C) + E (Y_{1} | D F) \cdot P r (D F)]}{P r (C) - P r (D F)} .

$\Delta_{IV} =\frac{[E(Y_1 |C) \cdot Pr(C)+E(Y_0 |D) \cdot Pr(D)]−[E(Y_0 |C) \cdot Pr(C)+E(Y_1 |DF) \cdot Pr(DF)]}{Pr(C) − Pr(DF)}.$ Ini menghasilkan beberapa wawasan. Estimator Wald IV adalah rata-rata tertimbang dari efek perawatan pada penyesuai dan negatif dari efek perawatan pada defiers.

Sekarang kita membuat dua asumsi. Pertama, kami menganggap monotonisitas, sehingga instrumen hanya dapat meningkatkan atau mengurangi kemungkinan partisipasi. Ini berarti . Asumsi monotonisitas sama dengan asumsi model fungsi indeks untuk perawatan. Asumsi kedua adalah bahwa ada beberapa penyesuai, yaitu mengatakan bahwa . Perilaku beberapa individu harus diubah oleh instrumen. Ini harus menjadi kasus jika instrumen tersebut relevan. Dua asumsi ini menghasilkan $Pr(DF) = 0$ $Pr(C) > 0$

Δ_{I V} = \frac{E (Y_{1} | C) \cdot P r (C) - E (Y_{0} | C) \cdot P r (C)}{P r (C)} = E (Y_{1} | C) - E (Y_{0} | C) = L A T E .

$\Delta_{IV} =\frac{E(Y_1 |C) \cdot Pr(C)−E(Y_0 |C) \cdot Pr(C)}{Pr(C)}=E(Y_1 |C)−E(Y_0 |C)=LATE.$

Dimitriy V. Masterov
sumber

+1, saya pikir dua jawaban saling melengkapi dengan sangat baik. Yang ini menunjukkan lebih banyak intuisi penduga Wald dan dari mana asumsinya berasal daripada hanya menggunakannya secara teknis murni

Andy