Cara menjaga variabel invarian waktu dalam model efek tetap

15

Saya memiliki data tentang karyawan perusahaan besar Italia selama lebih dari sepuluh tahun dan saya ingin melihat bagaimana kesenjangan gender dalam pendapatan pria-wanita berubah dari waktu ke waktu. Untuk tujuan ini saya menjalankan OLS dikumpulkan:

yit=Xitβ+δmalei+t=110γtdt+εit
di mana y adalah pendapatan log per tahun, Xit termasuk kovariat yang berbeda dengan individu dan waktu, dtadalah tahun bodoh dan malei sama dengan satu jika seorang pekerja adalah laki-laki dan nol jika tidak.

Sekarang saya memiliki kekhawatiran bahwa beberapa kovariat mungkin dapat dikorelasikan dengan efek tetap yang tidak teramati. Tetapi ketika saya menggunakan efek tetap (dalam) estimator atau perbedaan pertama saya kehilangan boneka gender karena variabel ini tidak berubah dari waktu ke waktu. Saya tidak ingin menggunakan penaksir efek acak karena saya sering mendengar orang mengatakan bahwa itu menempatkan asumsi yang sangat tidak realistis dan tidak mungkin berlaku.

Apakah ada cara untuk menjaga boneka jender dan mengontrol efek tetap pada saat yang sama? Jika ada cara, apakah saya perlu mengelompokkan atau mengurus masalah lain dengan kesalahan untuk tes hipotesis pada variabel gender?

user42263
sumber

Jawaban:

22

Ada beberapa cara potensial bagi Anda untuk menjaga boneka jender dalam regresi efek tetap.

Dalam Pengukur
Misalkan Anda memiliki model yang sama dibandingkan dengan model OLS dikumpulkan Anda yang mana variabel seperti sebelumnya. Sekarang perhatikan bahwa β 1 dan β 1 + γ 1 ( m a l e i ) tidak dapat diidentifikasi karena estimator dalam tidak dapat membedakannya dari efek tetap c i . Mengingat bahwa β 1 adalah intersep untuk tahun dasar t = 1 , γ 1 adalah efek gender pada pendapatan pada periode ini. Apa yang kita dapat mengidentifikasi dalam hal ini adalah γ 2 , . . .

yit=β1+t=210βtdt+γ1(malei)+t=110γt(dtmalei)+Xitθ+ci+ϵit
β1β1+γ1(malei)ciβ1t=1γ1 karena mereka berinteraksi dengan boneka waktu Anda dan mengukur perbedaan dalam efek parsial variabel gender Anda relatif terhadap periode waktu pertama. Ini berarti jika Anda mengamati peningkatan Anda γ 2 , . . . , γ 10 dari waktu ke waktu ini merupakan indikasi untuk memperlebar kesenjangan pendapatan antara pria dan wanita.γ2,...,γ10γ2,...,γ10

Pertama-Perbedaan Pengukur
Jika Anda ingin tahu efek keseluruhan dari perbedaan antara pria dan wanita dari waktu ke waktu, Anda dapat mencoba model berikut: dimana variabel t = 1 , . .

yit=β1+t=210βtdt+γ(tmalei)+Xitθ+ci+ϵit
berinteraksi dengan boneka jenis kelamin yang tidak berubah waktu. Sekarang jika Anda mengambil perbedaan pertama ß 1 dan c i putus dan Anda mendapatkan y i t - y i ( t - 1 ) = 10 Σ t = 3 β t ( d t - d ( t - 1 ) ) + γ ( t m a l e i -t=1,2,...,10β1ci Kemudian γ ( t m a l e i - [ ( t - 1 ) m a
yityi(t1)=t=310βt(dtd(t1))+γ(tmalei[(t1)malei])+(XitXi(t1))θ+ϵitϵi(t1)
dan Anda dapat mengidentifikasi perbedaan gender dalam pendapatan γ . Jadi persamaan regresi akhir akan: Δ y i t = 10 Σ t = 3 β t Δ d t + γ (γ(tmalei[(t1)malei])=γ[(t(t1))malei]=γ(malei)γ dan Anda mendapatkan efek yang menarik. Yang menyenangkan adalah bahwa ini mudah diimplementasikan dalam perangkat lunak statistik apa pun tetapi Anda kehilangan periode waktu.
Δyit=t=310βtΔdt+γ(malei)+ΔXitθ+Δϵit


ci1ci2

y~it=X~1it+X~2it+γ(male~i2)+c~i+ϵ~it
X~1it=X1itθ^iX¯1iθ^iX¯1i2ciX~2itX2itX¯2iX¯1i , sehingga Anda harus memiliki lebih banyak waktu bervariasi dari variabel waktu-invarian.

Semua ini mungkin terdengar sedikit rumit tetapi ada paket kalengan untuk penaksir ini. Misalnya, di Stata perintah yang sesuai adalahxthtaylor . Untuk informasi lebih lanjut tentang metode ini Anda dapat membaca Cameron dan Trivedi (2009) "Microeconometrics Using Stata". Kalau tidak, Anda bisa tetap menggunakan dua metode sebelumnya yang sedikit lebih mudah.

Kesimpulan
Untuk tes hipotesis Anda, tidak banyak yang perlu dipertimbangkan selain dari apa yang perlu Anda lakukan dalam regresi efek tetap. Anda perlu menjaga autokorelasi dalam kesalahan, misalnya dengan mengelompokkan pada variabel ID individu. Hal ini memungkinkan adanya struktur korelasi yang berubah-ubah di antara kelompok (individu) yang berhubungan dengan autokorelasi. Untuk referensi, lihat lagi Cameron dan Trivedi (2009).

Andy
sumber
4

Cara potensial lain bagi Anda untuk mempertahankan boneka gender adalah pendekatan Mundlak (1978) untuk model efek tetap dengan variabel waktu tidak berubah. Pendekatan Mundlak akan menyatakan bahwa efek gender dapat diproyeksikan pada sarana kelompok dari variabel yang bervariasi waktu.

Mundlak, Y. 1978: Pada penyatuan seri waktu dan data penampang. Econometrica 46: 69-85.

emeryville
sumber
2

Another method is to estimate the time-invariant coefficients in a second stage equation, using the mean error as the dependent variable.

First, estimate the model with FE. From here you get an estimation of β and γt. For simplicity, let's forget about the year-effects. Define the estimation error u^it as before:

u^ityitXitβ^

The linear predictor u¯i is:

u¯it=1Tu^iT=yit¯x¯iβ^

Now, consider the following second stage equation:

u¯i=δmalei+ci

Assuming that gender is uncorrelated with unobserved factors ci. Then, the OLS estimator of δ is unbiased and time-consistent (this is, it is consistent when T).


To prove the above, replace the original model into the estimator u¯i:

u¯i=x¯iβx¯iβ^+δmalei+ci+t=1TϵitT

The expectation of this estimator is:

E(u¯i)=x¯iβx¯iE(β^)+δmalei+E(ci)+t=1TE(ϵit)T

If assumptions for FE consistency hold, β^ is an unbiased estimator of β, and E(ϵit)=0. Thus:

E(u¯i)=δmalei+E(ci)

This is, our predictor is an unbiased estimator of the time-invariant components of the model.

Regarding consistency, the probability limit of this predictor is:

plimTu¯i=plimT(x¯iβ)plimT(x¯iβ^)+plimTδmalei+plimTci+plimT(t=1TϵitT)

Again, given FE assumptions, β^ is a consistent estimator of β, and the error term converges to its mean, which is zero. Therefore:

plimTu¯i=δmalei+ci

Again, our predictor is a consistent estimator of the time-invariant components of the model.

luchonacho
sumber
1

The Mundlak chamberlain device is a perfect tool for this. It is usually referred to as the correlated random effects model because it uses the random effect model to implicitly estimate fixed effects for time variant variables while also estimating the random effects for time invariant variables.

However, in statistical softwares, you implement it thesame as the random effect model but you have to add the means of all time variant covariates.

Martin Paul
sumber