Pendekatan Fungsi Kontrol dan Bootstrap

8

Mari kita mulai dengan asumsi bahwa saya memiliki data cross-sectional pada , , (lihat di bawah untuk , , ).yx1x2yx1x2

Saya ingin memperkirakan pengaruh variabel dan dan interaksinya ( ) pada variabel menggunakan pendekatan fungsi kontrol, dan sangat mungkin dan bersifat endogen. Saya punya dua instrumen, dan . Saya memperkirakan dua persamaan tahap pertama berikut dan saya menyimpan residu yang diprediksi dengan cara berikut:x1x2x3=x1x2yx1x2z1z2

ivreg2 x1 z1 z2 
predict error1hat, residuals
ivreg2 x2 z1 z2 
predict error2hat, residuals

Setelah saya menyimpan residu yang diprediksi, saya memperkirakan persamaan tahap kedua dengan cara berikut:

ivreg2 y x1 x2 x3 error1hat error2hat 

Meskipun perkiraan koefisien , dan masuk akal, saya tahu bahwa kesalahan standar tidak OK (lihat halaman 8 dari http://eml.berkeley.edu/~train/petrintrain.pdf ).x1x2x3

Pada halaman 8 dari http://eml.berkeley.edu/~train/petrintrain.pdf , penulis menyarankan untuk menggunakan bootstrap untuk mendapatkan kesalahan standar yang diperbaiki untuk , dan .x1x2x3

Pertanyaan saya adalah :

  1. Bagaimana saya mengatur bootstrap?
  2. Apakah bootstrap hanya diterapkan pada persamaan tahap kedua, atau apakah diterapkan pada persamaan tahap pertama dan kedua?

Sekarang, mari kita asumsikan bahwa saya memiliki data panel pada , , dan . Pertama, saya menggunakan perbedaan dalam-kelompok untuk menghapus heterogenitas yang tidak teramati, kemudian saya memperkirakan parameter menggunakan pendekatan fungsi kontrol seolah-olah data tersebut adalah data cross-sectional (lihat di atas). Apakah saya perlu membuat beberapa penyesuaian tambahan dalam hal saya menggunakan data panel sehubungan dengan kasus yang ditunjukkan di atas?yx1x2

Mark Vitale-Ferrari
sumber

Jawaban:

3

Cameron dan Trivedi - Microeconometrics menggunakan Stata membahas teknik bootstrap yang berbeda dan menunjukkan file kode Stata, misalnya, untuk penaksir dua langkah Heckman.

Mengenai pertanyaan 2.: Bootstrap memang diterapkan untuk persamaan tahap pertama dan kedua. Anda juga dapat melakukan bootstrap hanya pada tahap kedua tetapi kemudian Anda harus membuat asumsi lebih lanjut tentang distribusi variabel yang Anda prediksi (bootstrap parametrik). Mengatakan demikian, jauh lebih mudah untuk melakukan bootstrap dua tahap.

Mengenai pertanyaan 1.:

Anda dapat menemukan contoh kode (di Stata) untuk berbagai contoh di sini (2SLS) atau di sini (Heckman)

Berikut ini juga ikhtisar kecil yang gratis dan membahas beberapa topik yang juga dapat Anda temukan di buku Cameron dan Trivedi.

Saya harus mengatakan, saya pikir topiknya sering membingungkan, khususnya jika Anda memiliki beberapa tahap pertama, saya juga punya pertanyaan terbuka di sini , namun tanpa jawaban.

Pembaruan: Maaf, saya lupa mengomentari kasus data panel. Saya akan menggunakan kesalahan standar kuat cluster di setiap tahap bootstrap dua tahap dalam kasus ini.

PS: Stata memiliki file bantuan yang cukup rumit tentang bootstrap, Anda juga harus memeriksanya.

Arne Jonas Warnke
sumber