Meskipun pertanyaan ini sudah memiliki jawaban yang dapat diterima, saya pikir saya masih bisa berkontribusi untuk ini. Buku Koenker (2005) benar-benar tidak akan membuat Anda jauh karena perkembangan dalam regresi kuantil IV mulai meningkat sekitar waktu itu.
Teknik regresi kuantil IV awal termasuk kerangka kerja rantai sebab akibat oleh Chesher (2003) , yang dikembangkan lebih lanjut dalam pendekatan deviasi rata-rata tertimbang (WAD) oleh Ma dan Koenker (2006) . Dalam tulisan ini mereka juga memperkenalkan pendekatan variate kontrol. Ide serupa digunakan oleh Lee (2007) yang menurunkan estimator regresi kuantil IV menggunakan fungsi kontrol.
Semua estimator ini menggunakan asumsi struktur kesalahan triangular yang diperlukan untuk identifikasi. Masalah dengan ini adalah bahwa struktur segitiga ini tidak masuk akal untuk masalah endogenitas yang muncul karena simultanitas. Misalnya, Anda tidak dapat menggunakan estimator ini untuk masalah estimasi penawaran-permintaan.
Estimator oleh Abadie, Angrist dan Imbens (2002), yang Dimitriy V. Masterov sebutkan, mengasumsikan bahwa Anda memiliki variabel endogen biner dan instrumen biner. Secara umum, ini adalah kerangka kerja yang sangat membatasi tetapi memperluas pendekatan LATE dari regresi linier IV ke regresi kuantil. Ini bagus karena banyak peneliti, terutama di bidang ekonomi, akrab dengan konsep LATE dan interpretasi dari koefisien yang dihasilkan.
Makalah mani oleh Chernozhukov dan Hansen (2005) benar-benar memulai literatur ini dan kedua orang ini telah melakukan banyak pekerjaan di bidang ini. Penaksir regresi kuantil IV (IVQR) memberikan tautan alami ke penaksir 2SLS dalam konteks kuantil. Penaksir mereka diimplementasikan melalui Matlab atau Ox seperti yang Dimitriy tunjukkan tetapi Anda bisa melupakan makalah Kwak (2010) itu. Makalah ini tidak pernah sampai ke jurnal Stata dan juga kodenya tidak berjalan dengan baik. Saya menganggap dia meninggalkan proyek ini.
Alih-alih, Anda harus mempertimbangkan estimator persamaan estimasi smoothed IVQR (SEE-IVQR) oleh Kaplan and Sun (2012). Ini adalah estimator terbaru yang merupakan peningkatan dari estimator IVQR asli dalam hal kecepatan komputasi (ini menghindari algoritma pencarian grid yang memberatkan) dan berarti kesalahan kuadrat. Kode Matlab tersedia di sini .
Makalah oleh Frölich dan Melly (2010) bagus karena menganggap perbedaan antara regresi kuantil kondisional dan tanpa syarat. Masalah dengan regresi kuantil secara umum adalah bahwa sekali Anda memasukkan kovariat dalam regresi Anda, interpretasinya berubah. Dalam OLS, Anda selalu dapat beralih dari harapan bersyarat ke harapan tanpa syarat melalui hukum ekspektasi berulang, tetapi untuk kuantil ini tidak tersedia. Masalah ini pertama kali ditunjukkan oleh Firpo (2007) dan Firpo et al. (2009). Dia menggunakan fungsi pengaruh terpusat kembali untuk memarginalkan koefisien regresi kuantil bersyarat sehingga mereka dapat ditafsirkan sebagai koefisien OLS biasa. Untuk tujuan Anda, penaksir ini tidak akan banyak membantu karena memungkinkan untuk variabel eksogen saja. Jika Anda tertarik, Nicole Fortin membuat kode Stata tersedia di situs webnya.
Penaksir regresi kuantil tanpa syarat IV terbaru yang saya tahu adalah oleh Powell (2013) . Penaksir regresi kuantil generalnya (IV) memungkinkan Anda untuk memperkirakan efek perawatan kuantil marginal dengan adanya endogenitas. Di suatu tempat di situs web RAND ia juga membuat kode Stata-nya, saya tidak bisa menemukannya sekarang. Karena Anda memintanya: dalam makalah sebelumnya ia telah mengimplementasikan penaksir ini dalam konteks data panel (lihat Powell, 2012 ). Penaksir ini bagus karena tidak seperti semua metode panel data QR sebelumnya, penaksir ini tidak bergantung pada asimptotik T besar (yang biasanya tidak Anda miliki, setidaknya tidak dalam data mikroekonometrik).
Last but not least, varian yang lebih eksotis: penaksir IVQR yang disensor (CQIV) oleh Chernozhukov et al. (2011) memungkinkan untuk merawat data yang disensor - seperti namanya. Ini adalah perpanjangan dari makalah oleh Chernozhukov dan Hong (2003) yang tidak saya tautkan karena ini bukan untuk konteks IV. Estimator ini berat secara komputasi tetapi jika Anda memiliki data yang disensor dan tidak ada cara lain, ini adalah cara yang harus dilakukan. Amanda Kowalski telah menerbitkan kode Stata di situs webnya atau Anda dapat mengunduhnya dari RePEc. Estimator ini (dan, omong-omong, juga IVQR dan SEE-IVQR) menganggap bahwa Anda memiliki variabel endogen kontinu. Saya telah menggunakan estimator ini dalam konteks regresi pendapatan di mana pendidikan adalah variabel endogen saya yang mengambil antara 18 hingga 20 nilai, jadi tidak sepenuhnya kontinu. Tetapi dalam latihan simulasi saya selalu bisa menunjukkan bahwa ini bukan masalah. Namun, ini mungkin tergantung pada aplikasi jadi jika Anda memutuskan untuk menggunakan ini, periksa kembali.
Baru Handbook of Quantile Regresi memiliki dua bab yang sangat baik tentang topik ini:
sumber