Mengurangi Bentuk model ekonometrik, masalah identifikasi dan tes

7

Mencari bantuan untuk memahami masalah berikut dan cara menggunakan formulir yang diperkecil dalam ekonometrik

Pertimbangkan sebuah model untuk kesehatan seseorang:

heSebuahlth=b0+(b1)Sebuahge+(b2)wesayaght+(b3)hesayaght+(b4)mSebuahle+(b5)wHairk+(b6)exercsayase+kamu

berasumsi bahwa semua variabel dalam persamaan dengan pengecualian latihan tidak berkorelasi dengan u.

A) Tuliskan bentuk tereduksi untuk latihan, dan nyatakan kondisi di mana parameter persamaan diidentifikasi.

B) Bagaimana asumsi identifikasi pada bagian c diuji?


Apakah benar berasumsi:

exercsayase=b0+(b1)Sebuahge+(b2)wesayaght+(b3)hesayaght+(b4)mSebuahle+(b5)wHairk+kamu
sebagai bentuk tereduksi?

dan merupakan kondisi untuk mengidentifikasi parameter secara sederhana

E(exercsayase|kamu)=0

dan bagaimana saya bisa mengujinya? Tapi apalagi apa gunanya?

Clemente Cortile
sumber

Jawaban:

3

Ini adalah pertanyaan yang sangat standar pada Instrumental Variables model Single-Equation Linear. Mengingat primitif pertanyaan Anda, satu-satunya variabel endogen adalah olahraga . Untuk menjawab pertanyaan khusus ini, Anda memerlukan variabel eksotis, z , yang memenuhi dua syarat:

  1. cov (z, u) = 0.
  2. Pasti ada hubungan antara variabel endogen dan variabel eksogen yang Anda usulkan tetapi itu bukan bagian dari model yang dipostulatkan yang sebenarnya (model struktural). Dengan kata lain, dengan , dan ortogonal ke semua variabel penjelas Anda (selain dari olahraga) dan ke z.
    exercise=β0+β1age+β2weight+β3height+β4male+β5work+ϕz+εexercise
    ϕ0E(εexercise)=0

Sebelum melanjutkan, sebuah komentar. Dengan model struktural yang saya maksud, mengikuti konvensi Wooldridge dan Goldberger, model yang didalilkan. Artinya, model yang menyatakan hubungan sebab akibat antara kesehatan dan kovariat Anda. Ini adalah perbedaan utama dan ketidaksepakatan dengan jawaban sebelumnya.

Sekarang, kembali ke masalah yang dihadapi, kondisi 2 adalah apa yang dalam literatur persamaan simultan sebut persamaan bentuk tereduksi , yang tidak lain adalah proyeksi linear dari endogen ke semua variabel eksogen, termasuk z.

Sekarang, tancapkan formulir tereduksi ke model yang dipostulatkan dan Anda akan mendapatkannya

health=α0+α1age+α2weight+α3height+α4male+α5work+δz+ν
dimana αi=bi+b6βi,i{1,,5}, δ=b6ϕ dan ν=u+b6εexercise. Dengan definisi proyeksi linear,ν tidak berkorelasi dengan semua variabel penjelas dan karenanya OLS dari persamaan terakhir ini akan menghasilkan estimasi yang konsisten untuk αi dan δ, bukan yang mendasarinya bi dalam model yang benar.

Identifikasi memerlukan sedikit manipulasi dalam bentuk matriks tetapi pada dasarnya ia mengurangi kondisi peringkat yang disebut . Menetapkanb=(b0,...,b6) dan x=(1,Sebuahge,...,exercsayase) sehingga model struktural Anda heSebuahlth=xb+kamu. Sekarang tentukanz(1,Sebuahge,...,wHairk,z). Dengan kondisi 1 (cov (z, u) = 0 sehingga E (z, u) = 0),

E(zkamu)=0
Jika Anda mengalikan sisi sisi model struktural dengan z dan ambil harapan yang Anda miliki
E(zx)b=E(zy)
Kondisi peringkat menyatakan itu E(zx)adalah peringkat kolom penuh. Dalam contoh khusus ini dan kondisi yang diberikan pada z ini setara denganrSebuahnk(E(zx)=6. Karenanya kita memiliki 6 persamaan dalam 6 yang tidak diketahui. Oleh karena itu ada solusi unik untuk sistem yaitub diidentifikasi dan sama dengan [E(zx)]-1E(zy), seperti yang diinginkan.

Keterangan: Kondisi 1 berguna untuk mendapatkan kondisi momen tetapi dengan model formulir tereduksi ϕsangat penting untuk kondisi peringkat. Kedua kondisi itu biasa.

Pada titik ini harus jelas mengapa kita membutuhkan ini. Di satu sisi, tanpa penaksir OLS dari model sebenarnya akan menghasilkan penaksir tidak konsisten tidak hanya untukb6 tapi untuk semua bsaya. Di sisi lain (dan agak terkait), parameter kami diidentifikasi secara unik sehingga kami yakin bahwa kami memperkirakan hubungan sebab akibat yang sebenarnya seperti yang dinyatakan dalam model kami yang sebenarnya.

Sehubungan dengan pengujian, kondisi 2 (z dan olahraga sebagian berkorelasi) dapat diuji secara langsung dan Anda harus selalu melaporkan langkah yang bertentangan dengan komentar pada jawaban sebelumnya. Ada literatur besar sehubungan dengan langkah ini, khususnya literatur instrumen lemah.

Kondisi kedua tidak dapat diuji secara langsung. Kadang-kadang Anda mungkin menggunakan teori ekonomi untuk membenarkan atau memberikan hipotesis alternatif yang mendukung penggunaan z.

MauOlivares
sumber
3

Pertanyaan itu tidak masuk akal bagi saya seperti yang dinyatakan. Jika masalah mengatakan bahwa olahraga adalah endogen (berkorelasi dengan istilah kesalahan), Anda tidak dapat menganggap sebaliknya dalam solusi. Plus, orang biasanya berbicara tentang bentuk reduksi vs struktural dalam konteks estimasi IV. Jika olahraga bersifat endogen, Anda memerlukan instrumen untuk itu (variabel yang memprediksi olahraga, tetapi tidak memengaruhi kesehatan sebaliknya) untuk mendapatkan efek kausal. Misalnya, jika beberapa orang dalam sampel Anda secara acak memenangkan kupon keanggotaan gym, itu bisa menjadi instrumen yang valid.

Asumsi identifikasi akan menjadi

  1. kupon benar-benar memprediksi olahraga

  2. kupon itu ortogonal bagikamu

Apa yang disebut bentuk struktural akan menjadi dua persamaan, satu model asli Anda, regresi latihan lainnya pada kupon dan variabel penjelas lainnya dari model asli (tahap pertama). Bentuk yang dikurangi akan terjadi ketika Anda mengganti tahap pertama ke dalam persamaan utama, sehingga Anda mengurangi kesehatan pada usia, berat, ..., pekerjaan dan kupon (tetapi tidak berolahraga , seperti yang telah digantikan). Bentuk yang dikurangi kadang-kadang digunakan untuk menjelaskan properti estimasi IV, tetapi AFAIK tidak banyak digunakan dalam praktiknya.

ivansml
sumber