OLS: dalam persamaan 1 bias kesalahan standar dalam persamaan ke-2?

8

Misalkan adalah deret waktu dengan , ( dan - mirip dengan itu untuk , tetapi berubah ketika dummy = 1). dan , . Dalam pengaturan dunia nyata ini akan menjadi pengembalian pasar saham berkala atas perusahaan (tetapi Anda dapat mengabaikan ini). Ada dummy, yang sama dengan unity over dan sama dengan nol jika tidak. Model deret waktu yang diperkirakan dengan OLS adalah:Xit,YitXitN(0.1,1)σ2(Yit)=1mean(Yit)Xitt{1,2,...,200}i{1,2,...,N}NDtt{150,151,...,200}i

(1)Yit=αi+βiXit+γiDt+ϵit

Model ini umumnya mengikuti asumsi Gauss-Markov untuk setiap . Namun, kami memiliki untuk semua dan .iE[ϵitTϵjt]0ij

Langkah selanjutnya adalah membangun vektor gammas menggunakan estimasi model . Panggil vektor ini . Kami kemudian menggunakan ini dalam model cross-sectional:N(1)γ^

(2)γ^i=a+bZi+ui

di mana adalah beberapa variabel cross-sectional yang tidak menyebabkan pelanggaran dalam asumsi OLS dan relevan untuk menjelaskan \ hat {\ gamma} _i .Ziγ^i


Klaim dalam literatur ekonometrik yang diterapkan adalah bahwa dalam model mengarah ke (i) mengarah ke (i) Tidak ada masalah untuk estimasi koefisien OLS dalam , tetapi (ii) Bias kesalahan standar dalam .E[ϵitTϵjt]0(1)(2)(2)

  • Dapatkah seseorang mem-posting ide tentang mengapa hal ini terjadi?

  • Saya tidak mengerti apa yang dalam ekspresi . Tentu saja adalah skalar dan Anda tidak dapat mengubah skalar. Ini terlihat di SINI , di mana mereka menerapkan metodologi ini.ϵitTE[ϵitTϵjt]0ϵit


sumber
1
Anda mengatakan bahwa Anda tidak mengerti mengapa estimasi varians bias dalam persamaan 2 dan kemudian Anda mengatakan bahwa kami dapat mengabaikan estimasi yang merupakan persamaan 2? Saya pikir saya mengerti apa yang Anda maksud dan bisa memberikan jawaban spekulatif untuk itu tetapi akan lebih baik bagi Anda untuk menjawab pertanyaan Anda. γ
JDav
1
Dalam pengaturan Anda, tidak boleh stasioner, karena artinya tergantung pada . Yitt
mpiktas
Ada tiga versi harapan (satu di judul, yang lain di tubuh, dan yang ketiga di komentar). Semuanya menggabungkan transpose misterius meskipun dalam semua kasus hanya skalar yang hadir. Apakah Anda keberatan mengedit posting untuk diklarifikasi?
kardinal
@mpiktas Pengamatan yang benar, memiliki rata-rata yang berbeda setelah (diberikan ). Terima kasih. Yitt=150γi0
Beberapa jawaban yang baik telah disampaikan - Saya hanya ingin menambahkan bahwa ini perlu diperkirakan sebagai model koefisien acak (alias model bertingkat untuk sosiolog dan psikolog, alias model campuran untuk ahli biostatistik). Jika para ekonom tidak mengetahui hal ini, dan memperkirakannya dengan prosedur dua langkah, itu terlalu buruk bagi mereka (dan saya masih menunggu kesalahan standar Fama-Macbeth untuk mati, yang tampaknya tidak ingin mereka lakukan).
Tugas

Jawaban:

3

Untuk memastikan Anda perlu masuk ke detail, ini berarti membandingkan matriks kovarians varians yang sebenarnya dengan yang Anda dapatkan di tahap ols kedua.

Yang benar :

Ini dapat diperoleh dengan mengganti eq.2 menjadi eq.1, OLS yang dikumpulkan mengikuti, dan dari itu, yang benar a^,b^ matriks varians kovarians:

Yit=αi+βiXit+aDt+bDtZi+Dtui+ϵit

Menggunakan notasi matriks untuk membagi persamaan dalam γ parameter dan lainnya mengarah ke:

Y=Xθ+Zγ+ε

di mana kami tertarik V(γ^) , γ=[ab], Z adalah vektor dua kolom Z=[DtDtZi][i=1,..,N;t=1,...,T] (struktur serupa mendefinisikan X tetapi ini tidak menarik) dan di mana V(ε)=Σ memiliki struktur penuh antara kovarian perusahaan sehingga tidak diagonal (σ2sayaNT) seperti dalam asumsi GAUSS-MARKOV. Dengan Frish-Waugh kami dapat mengekspresikanγ ols sebagai:

γ^=(ZM.XZ)-1ZM.XY dimana M.X=saya-X(XX)-1X

yang menyiratkan varian sebenarnya berikut:

V(γ^)=HΣH dimana H=(ZM.XZ)-1ZM.X

Yang lain

Di bawah asumsi perusahaan yang tidak berkorelasi (dan periode waktu tetapi ini bukan masalahnya), Σ memiliki struktur diagonal yang lebih sederhana Δ. Ini artinyaΔ istilah segitiga adalah 0. Di bawah spesifikasi yang lebih sederhana, (yang diperkirakan secara default oleh perangkat lunak ekonometrik dan statistik untuk OLS) Σ mengikuti asumsi GAUSS-Markov yang berarti bahwa bahkan istilah diagonal sama dengan demikian Σ diturunkan menjadi σ2saya

Ini menyiratkan bahwa tidak mempertimbangkan korelasi antar perusahaan akan menyebabkan V(γ^)sebagai:

V(γ^)=HΔH atau V(γ^)=Hσ2IHσ2(ZMxZ)1

yang, seperti dapat dilihat, tidak sama dengan yang sebenarnya.

JDav
sumber
Dengan kata-kata yang berbeda .. Saya pada dasarnya memberikan jawaban yang sama @mpiktas memberi
JDav
(1) Sangat fantastis. (2) Sepertinya Anda telah mengabaikannyaDiuiketika Anda menyatakan model dalam bentuk matriks? Ini seharusnya tidak mengubah apa pun yang telah Anda lakukan. (3) Apakah Anda tahu mengapa Portofolio OLS memberikan SES yang benar? (Lihat kertas 1986 yang saya tautkan). Jangan repot-repot dengan jawaban (3) jika Anda tidak suka mencari tahu masalah itu.
(2) Saya tidak meletakkan semua definisi untuk membiarkan beberapa intuisi dan untuk menghindari produk kronecker ... dengan cara ini demo berjalan "lebih cepat". Tetapi Anda dapat menyimpulkan bahwa istilah acak yang baru adalahεit=Dtui+ϵit, ini berarti bahwa jika perusahaan dikorelasikan oleh ui maka ini menyebabkan istilah acak baru εituntuk dikorelasikan pada dimensi perusahaannya juga. (3) tidak mendengar tentang portofolio OLS, tapi saya rasa itu hanya nama lain untuk sesuatu yang sudah ada di ekonometrika standar untuk del dengan matriks Var penuh, seperti WLS, atau
Robs
(3) estimasi yang baik mengimplikasikan suatu yang baik Σ memperkirakan, portofolio OLS entah bagaimana memperkirakan struktur penuh Σ dan bukan hanya varian tanpa kovarian: Δ atau varian tunggal: σ2
JDav
2
Saya pikir notasi ini tidak lengkap, ia menggunakan skalar di mana vektor diperlukan untuk merujuk pada fakta bahwa antara perusahaan kovarian tidak nol sehingga notasinya menyiratkan ϵit=[ϵit]i=1,...,Nadalah vektor baris N. Interpretasi lain adalah yang dia maksudij elemen dari ϵ.tTϵ.t. Dalam kedua kasus, ia memiliki maksud yang sama, tetapi karena itu bukan ambiguitas jurnal kuantitatif dalam notasi matematika terjadi ...
JDav
2

Saya memberikan jawaban lain dengan lebih detail.

Dalam model regresi linier standar (dalam bentuk matriks):

Y=Xβ+ε

Estimasi OLS adalah sebagai berikut

β^=(XTX)1XTY.

Perbedaannya adalah

Var(β^)=(XTX)1XTVar(Y)X(XTX)1.

Asumsi biasa untuk regresi adalah itu

Var(Y)=σ2I,

dimana Iadalah matriks identitas. Kemudian

Var(β^)=σ2(XTX)1.

Sekarang dalam kasus Anda, Anda memiliki dua model:

Yi=Miδi+ϵi

dan

Γ=Lc+u,

dimana

  • YiT=(Yi1,...,YiT),
  • Mi=[1,Xi,D], dengan XiT=(Xi1,...,XiT), DT=(D1,...,DT)
  • δiT=(αi,βi,γi)
  • ϵiT=(ϵi1,...,ϵiT)
  • ΓT=(γ1,...,γn)
  • L=[1,Z], dengan ZT=(Z1,...,Zn)
  • cT=(a,b)
  • uT=(u1,...,uN).

Perhatikan bahwa Anda menyatakan model kedua untuk perkiraan dariγ, yang tidak biasa, maka saya menyatakan kembali dalam bentuk biasa, untuk "benar" γ.

Mari kita tuliskan matriks kovarians untuk estimasi koefisien OLS c:

Var(c^)=(LTL)1LTVar(Γ)L(LTL)1

Masalahnya adalah bahwa kita tidak memperhatikan Γ. Kami mengamati taksiranΓ^. γ^i adalah bagian dari vektor

δ^i=δi+(MiTMi)1MiTϵi.

Asumsikan bahwa δi bersifat acak dan independen dengan ϵi dan Mi. Ini tentu berlaku untukγi jadi kami tidak kehilangan apa pun jika kami memperluas ini untuk elemen lain dari δi.

Mari kita susun semua δ^i di atas satu sama lain:

δ^T=[δ1T,...,δNT]

dan menjelajahi varians dari δ^:

Var(δ^)=[Var(δ^1)cov(δ^1,δ^2)cov(δ^1,δ^N)cov(δ^n,δ^1)cov(δ^n,δ2)Var(δ^N)]

Asumsikan bahwa Var(ϵi)=σϵ2I dan itu EϵiϵjT=0. Untukij kita punya

cov(δ^i,δ^j)=cov(δi,δj)+cov((MiTMi)1MiTϵi,(MjTMj)1MjTϵj)=(MiTMi)1MiTE(ϵiϵjT)Mj(MjTMj)1=0

Untuk elemen diagonal yang kita miliki

Var(δ^i)=Var(δi)+σϵ2(MiTMi)1

Mari kita kembali ke varian c^. Karena kita gantikanΓ^ dari pada Γ variansnya adalah sebagai berikut

Var(c^)=(LTL)1LTVar(Γ^)L(LTL)1,

Kita bisa mengekstrak Var(Γ^) dari Var(δ^) dengan memilih elemen yang sesuai:

Var(Γ^)=Var(Γ)+diag(g1,...,gn)

dimana gi adalah elemen dari σϵ2(MiTMi)1 sesuai dengan Var(γ^i). Setiapgi berbeda dengan gj karena mereka sesuai dengan yang berbeda Xit dan Xjt yang tidak dianggap sama.

Jadi kita mendapatkan hasil yang mengejutkan, bahwa secara aljabar bahkan jika kita mengasumsikan semua sifat yang diperlukan, matriks kovarians yang dihasilkan setidaknya secara aljabar tidak akan sama dengan matriks kovarians OLS biasa, karena untuk itu kita memerlukan itu Var(Γ^) adalah matriks identitas waktu konstan yang jelas tidak.

Semua rumus di atas diturunkan dengan asumsi itu Xij konstan, sehingga mereka tergantung pada Xij. Ini berarti kita benar-benar menghitungVar(Γ^|X). Dengan menempatkan asumsi tambahanXij, Saya pikir akan mungkin untuk menunjukkan bahwa varian tanpa syarat adalah OK.

Asumsi independensi ditempatkan pada ϵi bisa juga santai untuk tidak berkorelasi.

Juga dimungkinkan untuk menggunakan studi simulasi untuk melihat bagaimana perbedaan matriks kovarians jika kita gunakan Γ^ dari pada Γ.

mpiktas
sumber
1

Saya pikir masalahnya terletak pada definisi model kedua. Saya pikir diasumsikan demikian

γi=a+bZi+ui

dengan asumsi biasa itu

cov(γi,γj|Z1,...,ZN)=0,

yaitu bahwa γi tidak berkorelasi jika kita mengendalikan Zi. Sekarang ketika Anda menggantiγ^ dari pada γ, Anda perlu memeriksa apakah asumsi tersebut berlaku, yaitu jika

cov(γi^,γ^j|Zi)=0.

Sekarang

γ^i=γi+L(ϵit),

dimana Ladalah beberapa fungsi linear. Aman untuk mengasumsikan ituϵit independen dari Zi, tapi jika Eϵitϵjt0, asumsi yang diperlukan tidak berlaku.

Karena asumsi tidak berkorelasi adalah penting untuk perhitungan statistik OLS biasa, ini memberikan alasan mengapa kesalahan standar bias.

Ini adalah garis besar kasar, tapi saya pikir ide itu akan berhasil jika Anda akan masuk ke rincian sepele mesin OLS.

mpiktas
sumber