Saya bekerja di Ekonomi Politik, dan banyak model termasuk variabel kontrol "tidak bersalah" seperti populasi, ketidaksetaraan, warisan kolonial, dll. Sehingga penulis dapat mengklaim ketidakberpihakan pada variabel independen yang mereka minati.
Tetapi jika salah satu dari variabel kontrol ini adalah endogen terhadap beberapa variabel yang dihilangkan, tidakkah ini mencemari ketidakberpihakan SEMUA variabel independen?
Jika itu benar, lalu apa yang bisa kita lakukan? Biarkan variabel kontrol tersebut keluar dan mereka menyebabkan bias variabel yang dihilangkan sendiri. Sertakan yang ada di dalam dan mereka akan mencemari semua yang ada dalam model.
Contoh: Seorang peneliti ingin mengetahui apakah ketidaksetaraan mengarah pada kekerasan, dan ia mengontrol beberapa hal: Melihat bahwa Ketidaksetaraan cenderung bersifat endogen ( karena variabel Tingkat altruisme yang dihilangkan ), ia akan mencoba menemukan variabel instrumental untuk Ketimpangan . Tetapi bukankah Pertumbuhan dan Pembangunan kemungkinan endogen (berkorelasi dengan Tingkat altruisme ) juga?
Contoh ini mungkin terlihat konyol, tetapi poin saya dalam pekerjaan Ekonomi / Pembangunan Politik, ada begitu banyak faktor yang berperan (belum dihilangkan) sehingga saya khawatir banyak variabel yang termasuk dalam LHS bersifat endogen. Namun seringkali, peneliti hanya mencari instrumen untuk variabel independen peliharaannya saja.
sumber
Jawaban:
"Tetapi jika salah satu dari variabel kontrol ini bersifat endogen terhadap beberapa variabel yang dihilangkan, bukankah ini mencemari ketidakberpihakan SEMUA variabel independen?"
Saya tidak ingin terlalu menekankan hal ini, tetapi perlu disebutkan bahwa ini tidak benar secara umum. Derivasi berikut diharapkan akan memberikan pemahaman tentang "kontaminasi" yang Anda sebutkan. Sebagai contoh tandingan sederhana, anggaplah bahwa proses menghasilkan data diberikan oleh mana Z tidak teramati. Misalkan C o v ( X 1 , Z ) = 0 , C o v ( X 2
"Apa yang bisa kita lakukan?"
Salah satu tantangan utama dalam melakukan ekonometrika yang baik adalah memikirkan strategi identifikasi potensial. Dalam jenis situasi yang Anda gambarkan, mungkin tidak ada yang dapat Anda lakukan selain mencoba mendekati masalah dengan cara yang berbeda.
sumber
Semua terlalu kuat, tetapi mungkin beberapa. Masalah ini disebut "noda". Lihatlah buktinya dalam catatan kuliah Greene di slide 5.
Emily Oster memiliki kertas kerja yang bagus (dan perintah Stata
psacalc
) yang dapat membantu mengikat bias.sumber
Dalam konteks estimasi Least-squares, cara kita harus (berupaya) menangani kemungkinan endogenitas regressor adalah melalui estimasi Variabel Instrumental. Pendekatan ini tidak tergantung pada hanya memiliki satu regresi endogen - Anda mungkin memiliki banyak. Dalam kasus seperti itu tentu saja Anda perlu menemukan lebih banyak instrumen yang membuat segalanya lebih sulit - tetapi pada prinsipnya, metode ini akan bekerja dengan cara yang sama.
Estimasi IV tidak menyelesaikan masalah bias, hanya menyediakan konsistensi untuk estimator. Tetapi tidak ada yang memecahkan masalah bias batang eksogenitas yang ketat itu sendiri (dan kemudian ada beberapa metode pengurangan bias). Tetapi jika Anda melihat-lihat situs SE lain, Cross Validated , yaitu tentang statistik, Anda akan melihat bahwa ahli statistik berpengalaman tidak benar-benar memberi banyak bobot pada properti yang tidak memihak - mereka fokus pada Mean-Square Efficiency untuk properti sampel terbatas, dan pada konsistensi untuk sifat sampel besar.
sumber
Ini adalah contoh dari apa yang oleh ahli statistik Andrew Gelman disebut sebagai "kekeliruan mengendalikan hasil jangka menengah". Berikut ini uraiannya tentang kekeliruan yang muncul ketika para peneliti bertanya apakah memiliki lebih banyak anak perempuan mengubah politik Anda. Keputusan untuk memiliki anak kedua tentu tergantung pada keputusan sebelumnya untuk memiliki anak pertama, dan sepertinya contoh yang jelas untuk mengendalikan variabel keputusan yang bersifat endogen.
Apakah memiliki putra membuat Anda lebih konservatif? Mungkin tidak. Masalah dengan mengontrol hasil jangka menengah
Mengenai komentar Anda bahwa "Biarkan variabel kontrol itu keluar dan mereka menyebabkan bias variabel yang dihilangkan sendiri.", Ini tampaknya tergantung pada jenis instrumen yang Anda dapatkan. Instrumen yang baik, yang benar-benar memenuhi persyaratan, harus independen dari istilah kesalahan pada tahap kedua dan independen dari segala sesuatu yang Anda kontrol secara langsung . Artinya, instrumen berubah Y hanya melalui X. Jadi instrumen yang cocok untuk ketidaksetaraan harus independen dari pertumbuhan dan perkembangan (semoga berhasil menemukan itu!) Jika kita percaya bahwa persamaan kekerasan adalah persamaan struktural untuk kekerasan.
sumber
Seperti yang telah ditunjukkan oleh pos-pos lain, regressor endogen dapat mencemari semua estimasi parameter dalam regresi ketika regressor berkorelasi.
Pertimbangkan model berikut (analog dengan notasi @ jmbejara)
sumber