Apa itu variabel instrumental?

36

Variabel instrumental menjadi semakin umum dalam ekonomi terapan dan statistik. Untuk yang belum tahu, dapatkah kita mendapatkan jawaban non-teknis untuk pertanyaan berikut:

  1. Apa itu variabel instrumental?
  2. Kapan seseorang ingin menggunakan variabel instrumental?
  3. Bagaimana seseorang menemukan atau memilih variabel instrumental?
Graham Cookson
sumber
4
Tidakkah Anda berpikir bahwa artikel Wikipedia tentang itu sudah cukup?
1
Pertanyaan seperti ini membutuhkan jenis respons posting wiki / blog. Saya pikir pertanyaan seharusnya tidak memerlukan jawaban yang panjang.
Saya tidak yakin hal yang benar untuk dilakukan adalah mengabaikan pertanyaan ini dan merujuk penanya ke wiki - terutama selama versi beta di mana kami mencoba membangun konten situs. Mungkin si penanya harus menyerahkan masing-masing pertanyaan ini secara individual sehingga mereka dapat ditangani dengan lebih baik.
russellpierce
3
@ mbq - contoh wikipedia tidak memenuhi syarat sebagai nonteknis. Ini sangat bergantung pada jargon dan persamaan.
rolando2
1
Ini telah menjadi umum di bidang ekonomi beberapa waktu di tahun 1980-an. Beberapa biostatis telah mendengarnya juga, dan menerapkannya dalam konteks model kesalahan pengukuran, di mana instrumen dianggap sebagai pengukuran tambahan yang tersedia. Mereka memenuhi syarat sebagai instrumen dalam konteks ekonometrik yang lebih luas: mereka berkorelasi dengan variabel bunga, dan mereka tidak berkorelasi dengan kesalahan pengukurannya.
Tugas

Jawaban:

41

[Berikut ini mungkin tampaknya sedikit teknis karena penggunaan persamaan tetapi terutama dibangun pada grafik panah untuk memberikan intuisi yang hanya membutuhkan pemahaman yang sangat dasar tentang OLS - jadi jangan ditolak.]

Misalkan Anda ingin memperkirakan efek kausal pada y i yang diberikan oleh koefisien estimasi untuk β , tetapi untuk beberapa alasan ada korelasi antara variabel penjelas Anda dan istilah kesalahan:xiyiβ

yi=α+βxi+ϵicorr

Hal ini mungkin terjadi karena kita lupa untuk menyertakan sebuah variabel penting yang juga berkorelasi dengan . Masalah ini dikenal sebagai dihilangkan Bias variabel dan kemudian Anda β tidak akan memberikan efek kausal (lihat di sini untuk detail). Ini adalah kasus ketika Anda ingin menggunakan instrumen karena hanya dengan begitu Anda dapat menemukan efek kausal yang sebenarnya.xiβ^

Instrumen adalah variabel baru yang tidak berkorelasi dengan ϵ i , tetapi itu berkorelasi baik dengan x i dan yang hanya memengaruhi y i hingga x i - jadi instrumen kami adalah apa yang disebut "eksogen". Seperti dalam bagan ini di sini:ziϵixiyixi

zixiyiϵi

Jadi bagaimana kita menggunakan variabel baru ini?
Mungkin Anda ingat ide tipe ANOVA di belakang regresi di mana Anda membagi variasi total variabel dependen menjadi komponen yang dijelaskan dan tidak dapat dijelaskan. Misalnya, jika Anda mundur Anda pada instrumen,xi

xitotal variation=a+πziexplained variation+ηiunexplained variation

maka Anda tahu bahwa variasi yang dijelaskan di sini adalah eksogen ke persamaan asli kami karena itu tergantung pada variabel eksogen saja. Jadi dalam hal ini, kami membagi kami x i menjadi bagian yang kita dapat mengklaim tentu eksogen (itulah bagian yang tergantung pada z i ) dan beberapa bagian dapat dijelaskan η i yang membuat semua variasi buruk yang berkorelasi dengan ε i . Sekarang kita mengambil bagian eksogen dari regresi ini, sebut saja ^ x i ,zixiziηiϵixi^

xi=a+πzigood variation=x^i+ηibad variation

dan menempatkan ini dalam regresi asli kita:

yi=α+βx^i+ϵi

Sekarang karena x i tidak berkorelasi lagi dengan ε i (ingat, kita "disaring" ini bagian dari x i dan meninggalkannya di η i ), kami secara konsisten dapat memperkirakan kami β karena instrumen telah membantu kami untuk memecahkan korelasi antara penjelasan bervariasi dan kesalahan. Ini adalah salah satu cara bagaimana Anda dapat menerapkan variabel instrumental. Metode ini sebenarnya disebut kuadrat 2-tahap, di mana regresi x i pada z i disebut "tahap pertama" dan persamaan terakhir di sini disebut "tahap kedua".x^iϵixiηiβxizi

Dalam hal gambar asli kami (saya meninggalkan keluar untuk tidak membuat berantakan tapi ingat bahwa itu ada!), Alih-alih mengambil rute langsung tapi cacat antara x i ke y i kami mengambil langkah menengah melalui x iϵixiyix^i

x^izixiyi

Berkat pengalihan kecil dari jalan kami ke efek kausal ini, kami dapat secara konsisten memperkirakan dengan menggunakan instrumen. Biaya pengalihan ini adalah bahwa model variabel instrumental umumnya kurang tepat, yang berarti bahwa mereka cenderung memiliki kesalahan standar yang lebih besar.β

Bagaimana kita menemukan instrumen?
Itu bukan pertanyaan yang mudah karena Anda perlu membuat kasus yang baik untuk mengapa Anda tidak akan berkorelasi dengan ε i - ini tidak dapat diuji secara resmi karena kesalahan yang benar adalah tidak teramati. Oleh karena itu tantangan utamanya adalah untuk menghasilkan sesuatu yang dapat dianggap sebagai eksogen seperti bencana alam, perubahan kebijakan, atau kadang-kadang Anda bahkan dapat menjalankan eksperimen acak. Jawaban lain memiliki beberapa contoh yang sangat bagus untuk ini jadi saya tidak akan mengulangi bagian ini.ziϵi

Andy
sumber
10
+1 Saya bersyukur akhirnya membaca jawaban terinci alih-alih daftar referensi atau tautan.
whuber
1
Luar biasa! Saya menjelaskan ini kepada siswa saya lebih "mnemonically" sebagai: diracuni / ternoda oleh faktor-faktor yang tidak teramati di ϵ . Regresi tahap pertama "membersihkan" / menghisap racun dari x . Kita dapat menggunakan versi "dibersihkan" dari x untuk menemukan koefisien kausal, β . xϵxxβ
MichaelChirico
Apakah ada argumen intuitif mengapa estimasi 2SLS untuk konsisten? Ketika kita menghitung x i , kita "menyaring" bagian dari x i yang berkorelasi dengan kesalahan, tetapi mengapa harus bahwa menyaring tidak perubahan x i dengan cara yang mengubah perkiraan kami untuk β ? βx^ixixiβ
user35734
Lihat di sini: stats.stackexchange.com/questions/64279/… atau Anda mungkin ingin mengajukan pertanyaan baru. Semoga ini membantu.
Andy
@ user35734 itu tidak konsisten tetapi konsisten asimptotik .
Vim
17

Sebagai ahli statistik medis tanpa pengetahuan ekonomi (etr) sebelumnya, saya berjuang untuk memahami variabel instrumental karena saya sering berjuang untuk mengikuti contoh mereka dan tidak memahami terminologi mereka yang agak berbeda (misalnya 'endogenitas', 'bentuk berkurang' ',' persamaan struktural ',' variabel yang dihilangkan '). Berikut adalah beberapa referensi yang saya temukan berguna (yang pertama harus tersedia secara bebas, tetapi saya khawatir yang lain mungkin memerlukan berlangganan):

Saya juga merekomendasikan bab 4 dari:

onestop
sumber
7

Non-teknis (biasanya hanya itu yang baik untuk saya): Ada kalanya X tidak hanya menyebabkan Y, tetapi Y juga menyebabkan X. Variabel instrumental adalah perangkat yang dapat "membersihkan" hubungan yang berantakan dan tidak nyaman ini sehingga perkiraan terbaik dapat dibuat dari efek X pada Y.

Variabel instrumental dipilih berdasarkan hubungannya: itu adalah penyebab X, tetapi, selain bertindak melalui X, itu tidak berpengaruh pada Y. Instrumen (atau instrumen) digunakan pada Tahap Satu untuk menghitung versi "baru" "of X, yang sama sekali bukan fungsi dari Y. Baru" diprediksi "X ini kemudian digunakan pada tahap kedua, dalam regresi yang lebih standar, untuk menjelaskan / memprediksi Y. Oleh karena itu istilah Regresi Least Squares Dua Tahap .

Seseorang biasanya menemukan IV dalam proses yang mengesampingkan atau di luar kendali X OR Y, seperti variabel yang bergantung pada hukum, kebijakan, tindakan alamiah, dll.

rolando2
sumber