Saya memiliki model ekonomi teoretis yaitu sebagai berikut,
Jadi teori mengatakan bahwa ada , dan faktor untuk memperkirakan .
Sekarang saya memiliki data nyata dan saya perlu memperkirakan , , . Masalahnya adalah bahwa set data riil hanya berisi data untuk dan ; tidak ada data untuk . Jadi model yang bisa saya muat sebenarnya adalah:
- Apakah boleh untuk memperkirakan model ini?
- Apakah saya kehilangan sesuatu memperkirakannya?
- Jika saya memperkirakan , b 2 , lalu kemana b 3 x 3 pergi?
- Apakah itu diperhitungkan oleh istilah kesalahan ?
Dan kami ingin mengasumsikan bahwa tidak berkorelasi dengan x 1 dan x 2 .
Jawaban:
Masalah yang perlu Anda khawatirkan disebut endogenitas . Lebih khusus, itu tergantung pada apakah berkorelasi dalam populasi dengan x 1 atau x 2x3 x1 x2 . Jika ya, maka terkait s akan menjadi bias. Itu karena metode regresi OLS memaksa residu, u i , untuk tidak berkorelasi dengan kovariat Anda, x j s. Namun, residu Anda terdiri dari beberapa keacakan tak tereduksi, ε i , dan variabel yang tidak teramati (tetapi relevan), x 3 , yang dengan ketentuanbj ui xj εi x3 adalah berkorelasi dengan dan / atau x 2 . Di sisi lain, jika kedua x 1 dan x 2 tidak berkorelasi dengan x 3 dalam populasi, maka bs mereka tidak akan bias oleh ini (mereka mungkin bias oleh sesuatu yang lain, tentu saja). Salah satu cara ahli ekonometri mencoba menangani masalah ini adalah dengan menggunakan variabel instrumental . x1 x2 x1 x2 x3 b
Demi kejelasan yang lebih besar, saya telah menulis simulasi cepat dalam R yang menunjukkan distribusi pengambilan sampel tidak bias / berpusat pada nilai sebenarnya dari β 2 , ketika itu tidak berkorelasi dengan x 3 . Namun, pada run kedua, perhatikan bahwa x 3 tidak berkorelasi dengan x 1 , tetapi tidak x 2 . Bukan kebetulan, b 1 adalah berisi, tapi b 2 adalah bias.b2 β2 x3 x3 x1 x2 b1 b2
sumber
Mari kita pikirkan hal ini secara geometris. Pikirkan "bola", permukaan bola. Ini digambarkan sebagai . Sekarang jika Anda memiliki nilai untuk x 2r2=ax2+by2+cz2+ϵ x2 , , z 2 , dan Anda memiliki pengukuran r 2 maka Anda dapat menentukan koefisien Anda "a", "b", dan "c". (Anda bisa menyebutnya ellipsoid, tetapi menyebutnya bola lebih sederhana.)y2 z2 r2
Jika Anda hanya memiliki istilah , dan y 2 maka Anda dapat membuat lingkaran. Alih-alih mendefinisikan permukaan bola, Anda akan menggambarkan lingkaran yang diisi. Persamaan yang Anda cocokkan adalah r 2 ≤ a x 2 + b y 2 + ϵ .x2 y2 r2≤ax2+by2+ϵ
Anda memproyeksikan "bola", apa pun bentuknya, ke dalam ekspresi untuk lingkaran. Itu bisa menjadi "bola" yang berorientasi diagonal yang berbentuk lebih seperti jarum jahit, dan komponen benar-benar menghancurkan perkiraan kedua sumbu. Itu bisa berupa bola yang terlihat seperti m & m yang hampir hancur di mana kapak koin adalah "x" dan "y", dan tidak ada proyeksi. Anda tidak dapat mengetahui mana itu tanpa informasi " z ".z z
Paragraf terakhir itu berbicara tentang kasus "informasi murni" dan tidak memperhitungkan kebisingan. Pengukuran dunia nyata memiliki sinyal dengan noise. Kebisingan di sepanjang perimeter yang sejajar dengan sumbu akan memiliki dampak yang jauh lebih kuat pada fit Anda. Meskipun Anda memiliki jumlah sampel yang sama, Anda akan memiliki lebih banyak ketidakpastian dalam estimasi parameter Anda. Jika itu adalah persamaan yang berbeda dari kasus berorientasi sumbu linear sederhana ini, maka segala sesuatunya dapat menjadi " berbentuk buah pir ". Persamaan Anda saat ini berbentuk bidang, jadi alih-alih memiliki batas (permukaan bola), z-data mungkin hanya pergi ke seluruh peta - proyeksi bisa menjadi masalah serius.
Apakah saya tetap bisa memodelkan? Itu adalah panggilan penghakiman. Seorang ahli yang memahami masalah-masalah tertentu mungkin menjawabnya. Saya tidak tahu apakah seseorang bisa memberikan jawaban yang baik jika mereka jauh dari masalah.
Anda kehilangan beberapa hal baik, termasuk kepastian dalam estimasi parameter, dan sifat model yang ditransformasikan.
Estimasi untuk menghilang ke epsilon dan ke estimasi parameter lainnya. Itu dimasukkan oleh seluruh persamaan, tergantung pada sistem yang mendasarinya.b3
sumber
Jawaban lainnya, meski tidak salah, sedikit mempersulit masalah ini.
sumber