vcovHC, vcovHAC, NeweyWest - yang berfungsi untuk digunakan?

10

Saya mencoba memperbarui model berbasis lm () saya untuk mendapatkan kesalahan dan pengujian standar yang benar. Saya benar-benar bingung yang menggunakan matriks VC. The sandwichpaket penawaran vcovHC, vcovHACdan NeweyWest. Sementara yang pertama hanya bertanggung jawab untuk heteroskedastisitas, dua yang terakhir menjelaskan korelasi serial dan heteroskedastisitas. Namun, dokumentasi tidak memberi tahu banyak tentang perbedaan antara dua yang terakhir (setidaknya saya tidak mengerti). Melihat fungsinya sendiri, saya menyadari bahwa NeweyWest sebenarnya memanggil vcovHAC.

Secara empiris hasil coeftest(mymodel, vcov. = vcovHAC)dan coeftest(mymodel, vcov. = NeweyWest)marah berbeda. Meskipun vcovHACagak dekat dengan hasil lm naif, menggunakan NeweyWest semua koefisien berubah tidak signifikan (tes bahkan mendekati 1).

hans0l0
sumber
Biasanya halaman bantuan R memberikan tautan ke artikel. Detail tepatnya biasanya berada di sana. Artikel Zeileis misalnya tersedia secara bebas dan berisi banyak informasi.
mpiktas
2
Artikel Zeileis secara khusus menyatakan bagaimana vcovHACperbedaannya NeweyWest. Untuk meringkas, metode HAC berbeda hanya berbeda pada pilihan bobot. NeweyWestmemiliki bobot yang ditentukan, vcovHACadalah fungsi umum, yang memungkinkan Anda menyediakan bobot sendiri, dan secara default menggunakan bobot Andrews.
mpiktas
@mpiktas: thx untuk ringkasan. Karena saya belum menentukan bobot apa pun, bobot bawaan masing-masing harus digunakan. Sekarang saya tahu, saya mungkin harus menyatakan kembali pertanyaan saya ke: Mengapa bobot default vcovHAC dan NeweyWest yang berbeda membuat perbedaan yang sangat besar dan bagaimana menentukan bobot? Maksud saya, Anda tahu bobot STATA atau paket lain yang digunakan?
hans0l0
xtkamutxtkamut

Jawaban:

3

"Sandwich" yang dimaksud adalah dua potong roti yang ditentukan oleh informasi yang diharapkan yang melampirkan daging yang ditentukan oleh informasi yang diamati. Lihat komentar saya sini dan di sini . Untuk regresi linier, persamaan estimasi adalah:

U(β)=XT(Y-XTβ)

Informasi yang diharapkan (roti) adalah:

SEBUAH=U(β)β=-(XTX)

Informasi yang diamati (daging) adalah:

B=E(U(β)U(β)T)=XT(Y-XTβ)(Y-XTβ)TX

SEBUAH-1BSEBUAH-1σ2(XTX)-1σ2n×n

R=(Y-XTβ)(Y-XTβ)

vcovHCR

Rsayasaya=(Ysaya-βXsaya.)2,0 di tempat lain

Estimator ini bekerja dengan sangat baik kecuali dalam sampel kecil (<40 sering diklaim). HC1-3 adalah berbagai koreksi sampel terbatas. HC3 umumnya berkinerja terbaik.

T adalah non-nol, sehingga matriks kovarians berskala dihasilkan berdasarkan pada struktur autoregresif yang umum digunakan. Ini adalah alasan untuk "vcovHAC". Di sini, metode yang sangat fleksibel dan umum dihasilkan untuk memperkirakan efek autoregresif: detailnya mungkin berada di luar cakupan pertanyaan Anda. Fungsi "meatHAC" adalah pekerja keras umum: metode default adalah Andrews '. Newey-West adalah kasus khusus dari estimator kesalahan autoregresif umum. Metode-metode ini memecahkan salah satu dari dua masalah: 1. pada tingkat berapa korelasi meluruh antara pengamatan "berdekatan" dan 2. berapa jarak yang masuk akal antara dua pengamatan? Ini Jika Anda memiliki data panel seimbang, penaksir kovarian ini berlebihan.geegeePaket sebaliknya menentukan struktur kovarians AR-1atau serupa.

Adapun yang akan digunakan, itu tergantung pada sifat analisis data dan pertanyaan ilmiah. Saya tidak akan menyarankan pemasangan semua jenis dan memilih salah satu yang terlihat terbaik, karena ini adalah masalah beberapa pengujian. Seperti yang saya singgung sebelumnya, penaksir vcovHC konsisten bahkan dengan adanya efek autoregresif, sehingga Anda dapat menggunakan dan membenarkan "model korelasi independensi kerja" dalam berbagai keadaan.

AdamO
sumber