2SLS tetapi Probit tahap kedua

15

Saya mencoba menggunakan analisis variabel instrumental untuk menyimpulkan hubungan sebab akibat dengan data observasi.

Saya telah menemukan regresi dua tahap kuadrat (2SLS) yang kemungkinan akan mengatasi masalah endogenitas dalam penelitian saya. Namun, saya ingin tahap pertama menjadi OLS dan tahap kedua agar sesuai dalam 2SLS. Berdasarkan bacaan dan pencarian saya, saya telah melihat peneliti menggunakan baik 2SLS atau tahap pertama dan OLS tahap kedua, tetapi bukan sebaliknya yang merupakan apa yang saya coba capai.

Saat ini saya menggunakan Stata dan perintah ivreg di Stata adalah untuk 2SLS lurus.

Veronica
sumber

Jawaban:

12

Kasing Anda kurang bermasalah daripada sebaliknya. Operator ekspektasi dan proyeksi linear melewati tahap pertama linier (misalnya OLS) tetapi tidak melalui yang non-linear seperti probit atau logit. Oleh karena itu bukan masalah jika Anda pertama kali mundur variabel endogen kontinu Anda pada instrumen Anda (s) Z , X i = a + Z i π + η i dan kemudian menggunakan nilai-nilai yang dipasang dalam tahap kedua probit untuk memperkirakan Pr ( Y i = 1 | X i ) = Pr ( βXZ

Xsaya=Sebuah+Zsayaπ+ηsaya
Pr(Ysaya=1|X^saya)=Pr(βX^saya+ϵsaya>0)

X^saya

// use a toy data set as example
webuse nlswork

// set up the program including 1st and 2nd stage
program my2sls
    reg grade age race tenure
    predict grade_hat, xb

    probit union grade_hat age race
    drop grade_hat
end

// obtain bootstrapped standard errors
bootstrap, reps(100): my2sls

Dalam contoh ini kami ingin memperkirakan pengaruh pendidikan bertahun-tahun terhadap kemungkinan berada dalam serikat pekerja. Mengingat bahwa tahun-tahun pendidikan cenderung bersifat endogen, kami memasukkannya dengan masa kerja bertahun-tahun pada tahap pertama. Tentu saja, ini tidak masuk akal dari sudut interpretasi tetapi menggambarkan kode.

Pastikan Anda menggunakan variabel kontrol eksogen yang sama di tahap pertama dan kedua. Dalam contoh di atas itu adalah age, racesedangkan instrumen (non-sensis) tenurehanya ada di tahap pertama.

Andy
sumber
Terima kasih banyak, ini menyelesaikan masalah yang saya hadapi. Terima kasih lagi.
Veronica
1
Sebenarnya penelitian menyarankan untuk menggunakan pendekatan fungsi kontrol untuk model nonlinear seperti logit, yang akan menggunakan residu dari tahap pertama bersama dengan variabel endogen, daripada nilai prediksi. Meskipun tampaknya ada kemajuan yang sering terjadi, lihat: stat.wharton.upenn.edu/~zijguo/…
robin.datadrivers
1
Maaf saya tidak memberikan kutipan untuk membandingkan dua pendekatan untuk model linier dan nonlinier. ncbi.nlm.nih.gov/pmc/articles/PMC2494557
robin.datadrivers
-1 Saya harus menurunkan suara jawaban ini, karena tampaknya secara umum tidak mungkin untuk meneruskan gagasan penaksir 2SLS ke model nonlinear pada tahap pertama dan / atau kedua. Mungkin benar untuk kasus LS tahap pertama dan tahap kedua (@Andy apakah Anda punya referensi untuk mendukung ini?), Tetapi setidaknya peringatan adalah dalam rangka karena saya telah melihat banyak orang melakukan ide 2SLS dalam segala macam kasus model nonlinear pada tahap pertama dan kedua dan itu adalah praktik yang bermasalah.
Momo