Saya mengerti bahwa definisi dasar endogenitas adalah bahwa tidak puas, tetapi apa artinya ini dalam pengertian dunia nyata? Saya membaca artikel Wikipedia, dengan contoh penawaran dan permintaan, mencoba memahaminya, tetapi tidak terlalu membantu. Saya telah mendengar deskripsi lain tentang endogen dan eksogen sebagai berada di dalam sistem dan berada di luar sistem dan itu masih tidak masuk akal bagi saya.
regression
causality
instrumental-variables
pengguna25901
sumber
sumber
R
.Jawaban:
Jawaban JohnRos sangat bagus. Dalam bahasa Inggris yang sederhana, endogenitas berarti Anda salah sebabkan. Model yang Anda tulis dan perkirakan tidak menangkap dengan baik cara kerja sebab-akibat di dunia nyata. Ketika Anda menulis:
Anda dapat memikirkan persamaan ini dalam beberapa cara. Anda bisa menganggapnya sebagai cara yang mudah untuk memprediksi berdasarkan nilaiAnda bisa menganggapnya sebagai cara yang mudah untuk memodelkan . Dalam salah satu dari kasus-kasus ini, tidak ada yang namanya endogenitas, dan Anda tidak perlu khawatir tentang hal itu.X E { Y | X }Y X E{Y|X}
Namun, Anda juga dapat menganggap persamaan tersebut sebagai perwujudan sebab akibat. Anda dapat menganggap sebagai jawaban untuk pertanyaan: "Apa yang akan terjadi pada jika saya mencapai sistem ini dan secara eksperimental meningkatkan sebesar 1?" Jika Anda ingin memikirkannya seperti itu, menggunakan OLS untuk memperkirakan jumlahnya sama dengan mengasumsikan bahwa: Y Xβ1 Y X
Kegagalan salah satu dari 3-5 umumnya akan menghasilkan , atau, tidak cukup setara, . Variabel instrumental adalah cara mengoreksi fakta bahwa Anda salah sebabkan (dengan membuat asumsi kausal yang lain). Sebuah uji coba terkontrol acak yang dilakukan dengan sempurna adalah cara untuk memaksa 3-5 menjadi benar. Jika Anda memilih secara acak, maka itu pasti bukan disebabkan oleh , , atau apa pun. Apa yang disebut "eksperimen alami" adalah upaya untuk menemukan keadaan khusus di dunia di mana 3-5 benar bahkan ketika kita tidak berpikir 3-5 biasanya benar.C o v ( X , ϵ ) ≠ 0 X Y ϵE{ϵ|X}≠0 Cov(X,ϵ)≠0 X Y ϵ
Dalam contoh JohnRos, untuk menghitung nilai upah pendidikan, Anda memerlukan interpretasi kausal dari , tetapi ada alasan bagus untuk meyakini bahwa 3 atau 5 salah.β1
Namun, kebingungan Anda bisa dimengerti. Sangat umum dalam kursus tentang model linier bagi instruktur untuk menggunakan interpretasi kausal dari saya berikan di atas sambil berpura-pura tidak memperkenalkan sebab akibat, berpura-pura bahwa "itu semua hanya statistik." Itu kebohongan pengecut, tetapi juga sangat umum.β1
Bahkan, itu adalah bagian dari fenomena yang lebih besar dalam biomedis dan ilmu sosial. Hampir selalu merupakan kasus bahwa kita mencoba untuk menentukan efek kausal pada --- itulah tujuan ilmu pengetahuan. Di sisi lain, itu juga hampir selalu terjadi bahwa ada beberapa cerita yang dapat Anda ceritakan mengarah pada kesimpulan bahwa salah satu dari 3-5 itu salah. Jadi, ada semacam ketidakjujuran yang dipraktikkan, cair, dan menyesatkan di mana kita menepis keberatan dengan mengatakan bahwa kita hanya melakukan pekerjaan asosiasional dan kemudian menyelinap kembali penafsiran kausal kembali ke tempat lain (biasanya di bagian pendahuluan dan kesimpulan dari makalah ini).YX Y
Jika Anda benar-benar tertarik, pria yang akan dibaca adalah Judea Perl. James Heckman juga bagus.
sumber
Izinkan saya menggunakan contoh:
Katakanlah Anda ingin mengukur pengaruh (sebab-akibat) pendidikan terhadap pendapatan. Anda mengambil tahun pendidikan dan data pendapatan dan mundur satu terhadap yang lainnya. Apakah Anda memulihkan apa yang Anda inginkan? Mungkin tidak! Ini karena pendapatan juga disebabkan oleh hal-hal selain pendidikan, tetapi yang berkorelasi dengan pendidikan. Sebut mereka "skill": Kita dapat dengan aman berasumsi bahwa tahun-tahun pendidikan dipengaruhi oleh "skill", karena semakin terampil Anda, semakin mudah mendapatkan pendidikan. Jadi, jika Anda merevisi tahun-tahun pendidikan tentang pendapatan, penaksir untuk efek pendidikan menyerap efek "keterampilan" dan Anda mendapatkan perkiraan yang terlalu optimis untuk kembali ke pendidikan. Ini untuk mengatakan, efek pendidikan terhadap pendapatan adalah bias (ke atas) karena pendidikan tidak eksogen terhadap pendapatan.
Endogenitas hanya masalah jika Anda ingin memulihkan efek kausal (tidak seperti korelasi belaka). Juga- jika Anda dapat merancang percobaan, Anda dapat menjamin bahwa dengan penugasan acak. Sayangnya, ini biasanya tidak mungkin dalam ilmu sosial.Cov(X,ϵ)=0
sumber
User25901 sedang mencari penjelasan langsung dan sederhana, dunia nyata apa arti istilah eksogen dan endogen. Menanggapi dengan contoh-contoh misterius atau definisi matematika tidak benar-benar menjawab pertanyaan yang diajukan.
Bagaimana cara saya memahami kedua istilah ini?
Inilah yang saya pikirkan:
Exo - eksternal, luar Endo - internal, dalam -genous - berasal dari
Exogeneous: Suatu variabel eksogen ke model jika tidak ditentukan oleh parameter dan variabel lain dalam model, tetapi diatur secara eksternal dan setiap perubahan itu berasal dari kekuatan eksternal.
Endogen: Suatu variabel bersifat endogen dalam suatu model jika setidaknya sebagian fungsi dari parameter lain dan variabel dalam suatu model.
sumber
Regresi OLS, dengan konstruksi, memberikan . Sebenarnya itu tidak benar. Ini memberikan oleh konstruksi. Perkiraan residual Anda tidak berkorelasi dengan regressor Anda, tetapi residual Anda yang diperkirakan dalam arti tertentu "salah".X′ϵ=0 X′ϵ^=0
Jika proses menghasilkan data yang benar beroperasi oleh , dan berkorelasi dengan , maka jika Anda cocok regresi meninggalkan keluar . Tentu saja, diperkirakan residual akan berkorelasi dengan . Mereka selalu demikian, sama seperti . Itu hanya fakta matematis. Ini adalah bias variabel yang dihilangkan.Y=α+βX+γZ+noise Z X X′noise≠0 Z X log(ex)=x
Katakan bahwa ditugaskan secara acak. Mungkin itu adalah hari dalam seminggu orang dilahirkan. Mungkin ini adalah eksperimen yang sebenarnya. Itu adalah sesuatu berkorelasi dengan yang memprediksi . Anda kemudian dapat menggunakan keacakan untuk memprediksi , dan kemudian menggunakan diprediksi untuk menyesuaikan model untuk .I Y X I X X Y
Itu adalah dua tingkat kuadrat terkecil, yang hampir sama dengan IV.
sumber
Dalam regresi kami ingin menangkap dampak kuantitatif dari variabel independen (yang kami anggap eksogen dan tidak tergantung pada sesuatu yang lain) pada variabel dependen yang diidentifikasi. Kami ingin tahu apa pengaruh bersih variabel eksogen terhadap variabel dependen - artinya variabel independen harus bebas dari pengaruh variabel lain. Cara cepat untuk melihat apakah regresi menderita masalah endogenitas adalah dengan memeriksa korelasi antara variabel independen dan residu. Tapi ini hanya pemeriksaan kasar kalau tidak tes formal endogenitas perlu dilakukan.
sumber