Variabel instrumental menjadi semakin umum dalam ekonomi terapan dan statistik. Untuk yang belum tahu, dapatkah kita mendapatkan jawaban non-teknis untuk pertanyaan berikut:
- Apa itu variabel instrumental?
- Kapan seseorang ingin menggunakan variabel instrumental?
- Bagaimana seseorang menemukan atau memilih variabel instrumental?
regression
econometrics
instrumental-variables
Graham Cookson
sumber
sumber
Jawaban:
[Berikut ini mungkin tampaknya sedikit teknis karena penggunaan persamaan tetapi terutama dibangun pada grafik panah untuk memberikan intuisi yang hanya membutuhkan pemahaman yang sangat dasar tentang OLS - jadi jangan ditolak.]
Misalkan Anda ingin memperkirakan efek kausal pada y i yang diberikan oleh koefisien estimasi untuk β , tetapi untuk beberapa alasan ada korelasi antara variabel penjelas Anda dan istilah kesalahan:xi yi β
Hal ini mungkin terjadi karena kita lupa untuk menyertakan sebuah variabel penting yang juga berkorelasi dengan . Masalah ini dikenal sebagai dihilangkan Bias variabel dan kemudian Anda β tidak akan memberikan efek kausal (lihat di sini untuk detail). Ini adalah kasus ketika Anda ingin menggunakan instrumen karena hanya dengan begitu Anda dapat menemukan efek kausal yang sebenarnya.xi βˆ
Instrumen adalah variabel baru yang tidak berkorelasi dengan ϵ i , tetapi itu berkorelasi baik dengan x i dan yang hanya memengaruhi y i hingga x i - jadi instrumen kami adalah apa yang disebut "eksogen". Seperti dalam bagan ini di sini:zi ϵi xi yi xi
Jadi bagaimana kita menggunakan variabel baru ini?xi
Mungkin Anda ingat ide tipe ANOVA di belakang regresi di mana Anda membagi variasi total variabel dependen menjadi komponen yang dijelaskan dan tidak dapat dijelaskan. Misalnya, jika Anda mundur Anda pada instrumen,
maka Anda tahu bahwa variasi yang dijelaskan di sini adalah eksogen ke persamaan asli kami karena itu tergantung pada variabel eksogen saja. Jadi dalam hal ini, kami membagi kami x i menjadi bagian yang kita dapat mengklaim tentu eksogen (itulah bagian yang tergantung pada z i ) dan beberapa bagian dapat dijelaskan η i yang membuat semua variasi buruk yang berkorelasi dengan ε i . Sekarang kita mengambil bagian eksogen dari regresi ini, sebut saja ^ x i ,zi xi zi ηi ϵi xiˆ
dan menempatkan ini dalam regresi asli kita:
Sekarang karena x i tidak berkorelasi lagi dengan ε i (ingat, kita "disaring" ini bagian dari x i dan meninggalkannya di η i ), kami secara konsisten dapat memperkirakan kami β karena instrumen telah membantu kami untuk memecahkan korelasi antara penjelasan bervariasi dan kesalahan. Ini adalah salah satu cara bagaimana Anda dapat menerapkan variabel instrumental. Metode ini sebenarnya disebut kuadrat 2-tahap, di mana regresi x i pada z i disebut "tahap pertama" dan persamaan terakhir di sini disebut "tahap kedua".xˆi ϵi xi ηi β xi zi
Dalam hal gambar asli kami (saya meninggalkan keluar untuk tidak membuat berantakan tapi ingat bahwa itu ada!), Alih-alih mengambil rute langsung tapi cacat antara x i ke y i kami mengambil langkah menengah melalui x iϵi xi yi xˆi
Berkat pengalihan kecil dari jalan kami ke efek kausal ini, kami dapat secara konsisten memperkirakan dengan menggunakan instrumen. Biaya pengalihan ini adalah bahwa model variabel instrumental umumnya kurang tepat, yang berarti bahwa mereka cenderung memiliki kesalahan standar yang lebih besar.β
Bagaimana kita menemukan instrumen?zi ϵi
Itu bukan pertanyaan yang mudah karena Anda perlu membuat kasus yang baik untuk mengapa Anda tidak akan berkorelasi dengan ε i - ini tidak dapat diuji secara resmi karena kesalahan yang benar adalah tidak teramati. Oleh karena itu tantangan utamanya adalah untuk menghasilkan sesuatu yang dapat dianggap sebagai eksogen seperti bencana alam, perubahan kebijakan, atau kadang-kadang Anda bahkan dapat menjalankan eksperimen acak. Jawaban lain memiliki beberapa contoh yang sangat bagus untuk ini jadi saya tidak akan mengulangi bagian ini.
sumber
Sebagai ahli statistik medis tanpa pengetahuan ekonomi (etr) sebelumnya, saya berjuang untuk memahami variabel instrumental karena saya sering berjuang untuk mengikuti contoh mereka dan tidak memahami terminologi mereka yang agak berbeda (misalnya 'endogenitas', 'bentuk berkurang' ',' persamaan struktural ',' variabel yang dihilangkan '). Berikut adalah beberapa referensi yang saya temukan berguna (yang pertama harus tersedia secara bebas, tetapi saya khawatir yang lain mungkin memerlukan berlangganan):
Variabel Instrumental Staiger D.. Seminar Cyber AcademyHealth dalam Metode Penelitian Layanan Kesehatan, Maret 2002. http://www.dartmouth.edu/~dstaiger/wpapers-Econ.htm
Newhouse JP, McClellan M. Econometrics dalam Hasil Penelitian: Penggunaan Variabel Instrumental. Tinjauan Tahunan Kesehatan Masyarakat 1998; 19: 17-34. http://dx.doi.org/10.1146/annurev.publhealth.19.1.17
Greenland S. Pengantar variabel instrumental untuk ahli epidemiologi. International Journal of Epidemiology 2000; 29: 722-729. http://dx.doi.org/10.1093/ije/29.4.722
Zohoori N, Savitz DA. Pendekatan ekonometrik untuk data epidemiologi: Menghubungkan endogenitas dan heterogenitas yang tidak teramati dengan perancu. Annals of Epidemiology 1997; 7: 251-257. http://dx.doi.org/10.1016/S1047-2797(97)00023-9
Saya juga merekomendasikan bab 4 dari:
sumber
Berikut adalah beberapa slide yang saya siapkan untuk kursus ekonometrika di UC Berkeley. Saya harap Anda menemukan mereka berguna --- Saya percaya mereka menjawab pertanyaan Anda dan memberikan beberapa contoh.
Ada juga perawatan yang lebih maju di halaman kursus untuk PS 236 dan PS 239 (kursus metode ilmu politik tingkat pascasarjana) di situs web saya: http://gibbons.bio/teaching.html .
Charlie
sumber
Non-teknis (biasanya hanya itu yang baik untuk saya): Ada kalanya X tidak hanya menyebabkan Y, tetapi Y juga menyebabkan X. Variabel instrumental adalah perangkat yang dapat "membersihkan" hubungan yang berantakan dan tidak nyaman ini sehingga perkiraan terbaik dapat dibuat dari efek X pada Y.
Variabel instrumental dipilih berdasarkan hubungannya: itu adalah penyebab X, tetapi, selain bertindak melalui X, itu tidak berpengaruh pada Y. Instrumen (atau instrumen) digunakan pada Tahap Satu untuk menghitung versi "baru" "of X, yang sama sekali bukan fungsi dari Y. Baru" diprediksi "X ini kemudian digunakan pada tahap kedua, dalam regresi yang lebih standar, untuk menjelaskan / memprediksi Y. Oleh karena itu istilah Regresi Least Squares Dua Tahap .
Seseorang biasanya menemukan IV dalam proses yang mengesampingkan atau di luar kendali X OR Y, seperti variabel yang bergantung pada hukum, kebijakan, tindakan alamiah, dll.
sumber