Kapan efek tetap benar-benar diperbaiki?

12

Pertimbangkan model efek tak teramati linier dari tipe: mana adalah karakteristik yang tidak diobservasi tetapi waktu-invarian dan adalah kesalahan, dan indeks masing-masing pengamatan dan waktu. Pendekatan tipikal dalam regresi efek tetap (FE) adalah dengan menghapus melalui individu dummies (LSDV) / de-meaning atau dengan first differencing. c e i t c i

yit=Xitβ+ci+eit
ceitci

Apa yang saya selalu bertanya-tanya: kapan benar-benar "diperbaiki"?ci

Ini mungkin muncul pertanyaan sepele tetapi izinkan saya memberi Anda dua contoh untuk alasan saya di balik itu.

  1. Misalkan kita mewawancarai seseorang hari ini dan meminta penghasilan, berat badan, dll. Jadi kita mendapatkan kita . Selama 10 hari ke depan kita pergi ke orang yang sama dan mewawancarainya lagi setiap hari, jadi kita memiliki data panel untuknya. Haruskah kita memperlakukan karakteristik yang tidak teramati sebagai tetap untuk periode 10 hari ini ketika pasti mereka akan berubah di beberapa titik lain di masa depan? Dalam 10 hari kemampuan pribadinya mungkin tidak berubah tetapi itu akan terjadi ketika ia bertambah tua. Atau bertanya dengan cara yang lebih ekstrem: jika saya mewawancarai orang ini setiap jam selama 10 jam sehari, karakteristiknya yang tidak teramati kemungkinan akan diperbaiki dalam "sampel" ini, tetapi seberapa bermanfaat hal ini?X

  2. Sekarang misalkan kita sebaliknya mewawancarai seseorang setiap bulan dari awal hingga akhir hidupnya selama sekitar 85 tahun. Apa yang akan tetap diperbaiki saat ini? Tempat lahir, jenis kelamin dan warna mata kemungkinan besar tetapi selain itu saya hampir tidak bisa memikirkan hal lain. Tetapi yang lebih penting: bagaimana jika ada karakteristik yang berubah pada satu titik dalam hidupnya tetapi perubahannya sangat kecil? Maka itu bukan efek tetap lagi karena berubah ketika dalam praktiknya karakteristik ini kuasi diperbaiki.

Dari titik statistik relatif jelas apa yang merupakan efek tetap tetapi dari titik intuitif ini adalah sesuatu yang sulit untuk saya pahami. Mungkin orang lain memiliki pemikiran ini sebelumnya dan muncul dengan argumen tentang kapan efek tetap benar-benar efek tetap. Saya akan sangat menghargai pemikiran lain tentang topik ini.

Andy
sumber
2
+1, pertanyaan bagus & jawaban bagus. Mungkin perlu diingat, "all models are wrong, but some are useful"- George Box .
gung - Reinstate Monica
Saya mungkin bingung tentang ini, tetapi bukan kontinum: 1) jika diperlakukan sebagai sama untuk semua , Anda memiliki model gabungan, 2) jika diperlakukan sama untuk semua (variabel dummy untuk grup, yang dapat mencakup "tahun" atau "hari"), Anda memiliki model FE, dan 3) jika diperlakukan sebagai distribusi, Anda memiliki model RE. Lihat: userwww.service.emory.edu/~tclark7/randomeffects.pdf . ciicizj[i]cj[i]
Wayne

Jawaban:

9

Jika Anda tertarik pada formulasi ini untuk inferensi kausal tentang maka jumlah yang tidak diketahui yang diwakili oleh hanya perlu stabil selama durasi penelitian / data untuk efek tetap untuk mengidentifikasi jumlah kausal yang relevan. βci

Jika Anda khawatir bahwa jumlah yang diwakili oleh tidak stabil bahkan selama periode ini maka efek tetap tidak akan melakukan apa yang Anda inginkan. Maka Anda dapat menggunakan efek acak, meskipun jika Anda mengharapkan korelasi antara acak dan Anda ingin mengkondisikan di dalam pengaturan multilevel. Kekhawatiran tentang korelasi ini sering menjadi salah satu motivasi untuk formulasi efek tetap karena dalam banyak (tetapi tidak semua) keadaan Anda tidak perlu khawatir tentang hal itu.ciciXiciX¯i

Singkatnya, kekhawatiran Anda tentang variasi dalam jumlah yang diwakili oleh sangat masuk akal, tetapi sebagian besar karena hal itu mempengaruhi data untuk periode yang Anda miliki daripada periode yang mungkin Anda miliki atau yang mungkin akhirnya Anda miliki tetapi tidak.ci

conjugateprior
sumber
+1 Saya suka jawaban ini. Tetapi bagaimana dengan perubahan yang sangat kecil dalam sesuatu yang seharusnya diperbaiki selama periode sampel? Jika orang saya dalam sampel 10 hari mengenai kepalanya pada hari 6 dan kurang cerdas setelah itu dengan jumlah yang sangat kecil diwakili oleh sel-sel otak yang mati (seperti contoh sepele): apakah kemampuannya masih dapat diperlakukan sebagai efek tetap jika itu hampir diperbaiki?
Andy
1
Tentu. Mungkin pikirkan seperti ini: ini adalah parameter yang diperbaiki dan mungkin mewakili sesuatu di dunia yang 'benar-benar' konstan, atau mungkin tidak misalnya jika itu mewakili rata-rata dari sesuatu yang sebenarnya bervariasi. Pertanyaannya adalah: perbedaan inferensial apa yang dihasilkannya untuk memberikan efek yang pasti pada sesuatu yang lain. Dalam kasus inferensial kausal, pertanyaannya adalah: apakah asumsi efek tetap mengurangi perancu lebih dari variasi kecil yang dibiarkan tidak tertangkap oleh peningkatan parameter perancu.
conjugateprior
@Andy: Begitu Anda mulai berbicara tentang benjolan di kepala yang mengubah IQ seseorang karena beberapa sel otak mengalami trauma, di mana ia berhenti? Tidak ada yang Anda ukur di dunia nyata yang tetap sehingga tidak berubah (sangat kecil) setiap saat, jika Anda bisa mengukurnya dengan cukup akurat. Anda hanya perlu menggunakan penilaian yang masuk akal, dan secara eksplisit tentang penilaian itu ketika menyatakan hasil Anda. Seperti kata conjugateprior, efek tetap juga merupakan konsep yang berbeda dari "tidak dapat diubah" dan mengacu pada hal tertentu (parameter) dan tujuan spesifik Anda (populasi, kelompok, dll).
Wayne
Anda benar bahwa contoh dengan sel-sel otak agak dibuat-buat. Saya hanya ingin berpikir lebih banyak tentang sifat efek tetap karena sebagian besar buku teks dan ceramah agak diam tentang aspek intuitif ini. Tentu mereka memberikan contoh tetapi tidak ada yang akan menjawab pertanyaan saya. Untuk tujuan ini saya merasa sangat berguna untuk memunculkan pertanyaan ini di sini dan jawaban serta komentar sejauh ini sangat berguna.
Andy
2

Perbedaan antara efek tetap dan efek acak biasanya tidak memiliki implikasi pada perkiraan (Edit: setidaknya dalam buku teks sederhana kasus tidak berkorelasi), selain masalah efisiensi, tetapi implikasi yang cukup besar untuk pengujian.

Untuk keperluan pengujian, pertanyaan yang harus Anda tanyakan pada diri Anda adalah berapa tingkat kebisingan yang harus dilampaui oleh sinyal Anda? Yaitu, untuk populasi apa Anda ingin menggeneralisasi temuan Anda? Menggunakan contoh (1): haruskah itu variabilitas pada hari yang sama, periode yang lebih lama, atau variabilitas terhadap individu yang berbeda?

Semakin banyak komponen varians yang Anda simpulkan, semakin kuat temuan ilmiah Anda, dengan peluang yang lebih baik untuk ditiru. Secara alami ada batas untuk jumlah generalisasi yang dapat Anda minta, karena tidak hanya suara semakin kuat, tetapi juga sinyal ( )) semakin lemah. Untuk melihat ini, bayangkan adalah efek yang diharapkan dari terhadap berat badan tetapi tidak selama beberapa periode kehidupan subjek tunggal, tetapi lebih dari semua mamalia .E(ciE(ci)Xi

JohnRos
sumber
Saya dapat mengikuti sisa jawaban Anda, tetapi saya ragu tentang bagian pertama. Efek tetap memungkinkan untuk korelasi sewenang-wenang antara dan efek tetap, sementara dalam efek acak keduanya harus tidak berkorelasi. Jika ini tidak benar, maka RE tidak konsisten. Jadi ini memang berimplikasi pada estimasi. X
Andy
dan bahkan jika acak tidak berkorelasi dengan mereka masih akan menyusut satu sama lain relatif terhadap perkiraan tetap . cXc
conjugateprior
@conjugateprior: memang akan menyusut, tetapi inferensi grup ada di yang tidak menyusut. ciE(ci)
JohnRos
@Andy: Saya tidak melihat alasan untuk tidak memungkinkan korelasi antara efek dan kebisingan di RE, tetapi jika kita menyetujui sisa jawaban, saya lebih baik mengedit jawaban saya.
JohnRos
2

Saya telah bergumul dengan pertanyaan serupa, lihat A Festschrift (posting blog) untuk Tuhan, paradoksnya dan prediksi Novick , dan inilah upaya terbaik saya (semoga dengan koreksi jika saya salah besar). Jika kita menjatuhkan kejutan non-acak, , dari persamaan yang kita miliki:Xitβ

yit=ci+eit

Yang dapat dilihat sebagai jalan acak dengan mundur lebih jauh ke masa:

yit=ci+eityit1=ci+eit1yityit1=eiteit1

Jadi ini hanya reframing jawaban konjugat prior "hanya perlu stabil selama masa studi" - tetapi reframing yang saya temukan bermanfaat. Jadi, selama durasi penelitian adalah masuk akal untuk mempertimbangkan bahwa jika tidak ada perawatan yang menarik, bagian , apakah hasilnya akan berjalan secara acak, hanya dipandu oleh kejutan eksogen acak - ' s? Tentu saja ini tidak benar, kecuali untuk keadaan yang agak rumit.e i tXitβeit

Di situlah saran saya berakhir. Seperti gung menyebutkan ungkapan George Box, "semua model salah, tetapi beberapa berguna". Anda akan tahu lebih baik daripada saya bagaimana menentukan kapan penyederhanaan ini dibenarkan dalam desain penelitian tertentu. Dapat diasumsikan kita tidak dapat mengamati sama seperti jalan acak bukanlah representasi realitas yang akurat - bahkan untuk sepotong kecil waktu.ci

Saya mungkin menebak untuk contoh khusus Anda dari survei, pertanyaan yang mengukur data jenis aliran (misalnya pendapatan, berat) mungkin masuk akal karena berjalan secara acak dalam kerangka waktu yang sangat singkat. Data tipe stok (seperti berapa banyak kopi yang Anda minum hari ini ) tampaknya sedikit lebih anggapan buruk.

Andy W
sumber
+1 Terima kasih atas tautan dan jawaban Anda! Saya senang bahwa pertanyaan ini masih menarik minat dan lebih banyak yang dapat ditambahkan. Ini sangat mendalam.
Andy