Kasing Anda kurang bermasalah daripada sebaliknya. Operator ekspektasi dan proyeksi linear melewati tahap pertama linier (misalnya OLS) tetapi tidak melalui yang non-linear seperti probit atau logit. Oleh karena itu bukan masalah jika Anda pertama kali mundur variabel endogen kontinu Anda pada instrumen Anda (s) Z ,
X i = a + Z ′ i π + η i
dan kemudian menggunakan nilai-nilai yang dipasang dalam tahap kedua probit untuk memperkirakan
Pr ( Y i = 1 | X i ) = Pr ( βXZ
Xsaya= a + Z′sayaπ+ ηsaya
Pr ( Ysaya= 1 | Xˆsaya) = Pr ( βXˆsaya+ ϵsaya> 0 )
Xˆsaya
// use a toy data set as example
webuse nlswork
// set up the program including 1st and 2nd stage
program my2sls
reg grade age race tenure
predict grade_hat, xb
probit union grade_hat age race
drop grade_hat
end
// obtain bootstrapped standard errors
bootstrap, reps(100): my2sls
Dalam contoh ini kami ingin memperkirakan pengaruh pendidikan bertahun-tahun terhadap kemungkinan berada dalam serikat pekerja. Mengingat bahwa tahun-tahun pendidikan cenderung bersifat endogen, kami memasukkannya dengan masa kerja bertahun-tahun pada tahap pertama. Tentu saja, ini tidak masuk akal dari sudut interpretasi tetapi menggambarkan kode.
Pastikan Anda menggunakan variabel kontrol eksogen yang sama di tahap pertama dan kedua. Dalam contoh di atas itu adalah age, race
sedangkan instrumen (non-sensis) tenure
hanya ada di tahap pertama.