Pertimbangkan model efek tak teramati linier dari tipe: mana adalah karakteristik yang tidak diobservasi tetapi waktu-invarian dan adalah kesalahan, dan indeks masing-masing pengamatan dan waktu. Pendekatan tipikal dalam regresi efek tetap (FE) adalah dengan menghapus melalui individu dummies (LSDV) / de-meaning atau dengan first differencing. c e i t c i
Apa yang saya selalu bertanya-tanya: kapan benar-benar "diperbaiki"?
Ini mungkin muncul pertanyaan sepele tetapi izinkan saya memberi Anda dua contoh untuk alasan saya di balik itu.
Misalkan kita mewawancarai seseorang hari ini dan meminta penghasilan, berat badan, dll. Jadi kita mendapatkan kita . Selama 10 hari ke depan kita pergi ke orang yang sama dan mewawancarainya lagi setiap hari, jadi kita memiliki data panel untuknya. Haruskah kita memperlakukan karakteristik yang tidak teramati sebagai tetap untuk periode 10 hari ini ketika pasti mereka akan berubah di beberapa titik lain di masa depan? Dalam 10 hari kemampuan pribadinya mungkin tidak berubah tetapi itu akan terjadi ketika ia bertambah tua. Atau bertanya dengan cara yang lebih ekstrem: jika saya mewawancarai orang ini setiap jam selama 10 jam sehari, karakteristiknya yang tidak teramati kemungkinan akan diperbaiki dalam "sampel" ini, tetapi seberapa bermanfaat hal ini?
Sekarang misalkan kita sebaliknya mewawancarai seseorang setiap bulan dari awal hingga akhir hidupnya selama sekitar 85 tahun. Apa yang akan tetap diperbaiki saat ini? Tempat lahir, jenis kelamin dan warna mata kemungkinan besar tetapi selain itu saya hampir tidak bisa memikirkan hal lain. Tetapi yang lebih penting: bagaimana jika ada karakteristik yang berubah pada satu titik dalam hidupnya tetapi perubahannya sangat kecil? Maka itu bukan efek tetap lagi karena berubah ketika dalam praktiknya karakteristik ini kuasi diperbaiki.
Dari titik statistik relatif jelas apa yang merupakan efek tetap tetapi dari titik intuitif ini adalah sesuatu yang sulit untuk saya pahami. Mungkin orang lain memiliki pemikiran ini sebelumnya dan muncul dengan argumen tentang kapan efek tetap benar-benar efek tetap. Saya akan sangat menghargai pemikiran lain tentang topik ini.
"all models are wrong, but some are useful"
- George Box .Jawaban:
Jika Anda tertarik pada formulasi ini untuk inferensi kausal tentang maka jumlah yang tidak diketahui yang diwakili oleh hanya perlu stabil selama durasi penelitian / data untuk efek tetap untuk mengidentifikasi jumlah kausal yang relevan.β ci
Jika Anda khawatir bahwa jumlah yang diwakili oleh tidak stabil bahkan selama periode ini maka efek tetap tidak akan melakukan apa yang Anda inginkan. Maka Anda dapat menggunakan efek acak, meskipun jika Anda mengharapkan korelasi antara acak dan Anda ingin mengkondisikan di dalam pengaturan multilevel. Kekhawatiran tentang korelasi ini sering menjadi salah satu motivasi untuk formulasi efek tetap karena dalam banyak (tetapi tidak semua) keadaan Anda tidak perlu khawatir tentang hal itu.ci ci Xi ci X¯i
Singkatnya, kekhawatiran Anda tentang variasi dalam jumlah yang diwakili oleh sangat masuk akal, tetapi sebagian besar karena hal itu mempengaruhi data untuk periode yang Anda miliki daripada periode yang mungkin Anda miliki atau yang mungkin akhirnya Anda miliki tetapi tidak.ci
sumber
Perbedaan antara efek tetap dan efek acak biasanya tidak memiliki implikasi pada perkiraan (Edit: setidaknya dalam buku teks sederhana kasus tidak berkorelasi), selain masalah efisiensi, tetapi implikasi yang cukup besar untuk pengujian.
Untuk keperluan pengujian, pertanyaan yang harus Anda tanyakan pada diri Anda adalah berapa tingkat kebisingan yang harus dilampaui oleh sinyal Anda? Yaitu, untuk populasi apa Anda ingin menggeneralisasi temuan Anda? Menggunakan contoh (1): haruskah itu variabilitas pada hari yang sama, periode yang lebih lama, atau variabilitas terhadap individu yang berbeda?
Semakin banyak komponen varians yang Anda simpulkan, semakin kuat temuan ilmiah Anda, dengan peluang yang lebih baik untuk ditiru. Secara alami ada batas untuk jumlah generalisasi yang dapat Anda minta, karena tidak hanya suara semakin kuat, tetapi juga sinyal ( )) semakin lemah. Untuk melihat ini, bayangkan adalah efek yang diharapkan dari terhadap berat badan tetapi tidak selama beberapa periode kehidupan subjek tunggal, tetapi lebih dari semua mamalia .E(ci E(ci) Xi
sumber
Saya telah bergumul dengan pertanyaan serupa, lihat A Festschrift (posting blog) untuk Tuhan, paradoksnya dan prediksi Novick , dan inilah upaya terbaik saya (semoga dengan koreksi jika saya salah besar). Jika kita menjatuhkan kejutan non-acak, , dari persamaan yang kita miliki:Xitβ
Yang dapat dilihat sebagai jalan acak dengan mundur lebih jauh ke masa:
Jadi ini hanya reframing jawaban konjugat prior "hanya perlu stabil selama masa studi" - tetapi reframing yang saya temukan bermanfaat. Jadi, selama durasi penelitian adalah masuk akal untuk mempertimbangkan bahwa jika tidak ada perawatan yang menarik, bagian , apakah hasilnya akan berjalan secara acak, hanya dipandu oleh kejutan eksogen acak - ' s? Tentu saja ini tidak benar, kecuali untuk keadaan yang agak rumit.e i tXitβ eit
Di situlah saran saya berakhir. Seperti gung menyebutkan ungkapan George Box, "semua model salah, tetapi beberapa berguna". Anda akan tahu lebih baik daripada saya bagaimana menentukan kapan penyederhanaan ini dibenarkan dalam desain penelitian tertentu. Dapat diasumsikan kita tidak dapat mengamati sama seperti jalan acak bukanlah representasi realitas yang akurat - bahkan untuk sepotong kecil waktu.ci
Saya mungkin menebak untuk contoh khusus Anda dari survei, pertanyaan yang mengukur data jenis aliran (misalnya pendapatan, berat) mungkin masuk akal karena berjalan secara acak dalam kerangka waktu yang sangat singkat. Data tipe stok (seperti berapa banyak kopi yang Anda minum hari ini ) tampaknya sedikit lebih anggapan buruk.
sumber