Misalkan Anda memiliki satu bagian penampang data di mana individu berada di dalam kelompok (misalnya siswa di sekolah) dan Anda ingin memperkirakan model bentuk di Y_i = a + B*X_i
mana X
merupakan vektor karakteristik tingkat individu dan a
konstanta.
Dalam hal ini, anggaplah bias heterogenitas antar-kelompok yang tidak terobservasi dari estimasi poin Anda B
dan SE mereka karena itu berkorelasi dengan variabel bebas minat Anda.
Salah satu opsi adalah untuk mengelompokkan UK Anda berdasarkan kelompok (sekolah). Lain adalah memasukkan FE kelompok. Lain adalah menggunakan keduanya. Apa yang harus dipertimbangkan ketika memilih antara opsi-opsi ini? Secara khusus tidak jelas mengapa seseorang dapat mengelompokkan SE berdasarkan kelompok DAN menggunakan kelompok FE. Dalam kasus spesifik saya, saya memiliki 35 grup dan 5.000 individu yang bersarang di dalam setiap grup. Saya telah mengikuti diskusi di pdf ini , tetapi tidak terlalu jelas tentang mengapa dan kapan seseorang dapat menggunakan kedua S yang berkerumun dan efek tetap.
(Tolong diskusikan pro dan kontra dari SEs yang berkelompok vs FE daripada menyarankan saya hanya cocok dengan model bertingkat).
sumber
Efek tetap adalah untuk menghapus heterogenitas yang tidak teramati ANTARA berbagai kelompok dalam data Anda.
Saya tidak setuju dengan implikasi dalam respons yang diterima bahwa keputusan untuk menggunakan model FE akan tergantung pada apakah Anda ingin menggunakan "variasi kurang atau tidak". Jika variabel dependen Anda dipengaruhi oleh variabel yang tidak dapat diobservasi yang secara sistematis bervariasi antar kelompok di panel Anda, maka koefisien pada variabel apa pun yang berkorelasi dengan variasi ini akan menjadi bias. Kecuali jika variabel X Anda telah ditetapkan secara acak (dan mereka tidak akan pernah dengan data observasi), biasanya cukup mudah untuk membuat argumen untuk variabel yang dihilangkan bias. Kamu mungkindapat mengontrol beberapa variabel yang dihilangkan dengan daftar variabel kontrol yang baik, tetapi jika identifikasi yang kuat adalah tujuan nomor 1 Anda, bahkan daftar kontrol yang luas dapat memberikan ruang bagi pembaca kritis untuk meragukan hasil Anda. Dalam kasus ini, biasanya merupakan ide yang baik untuk menggunakan model efek tetap.
Kesalahan standar yang dikelompokkan untuk akuntansi untuk situasi di mana pengamatan DALAM SETIAP kelompok tidak iid (didistribusikan secara independen dan identik).
Contoh klasik adalah jika Anda memiliki banyak pengamatan untuk panel perusahaan sepanjang waktu. Anda dapat memperhitungkan efek tetap tingkat perusahaan, tetapi mungkin masih ada beberapa variasi yang tidak dapat dijelaskan dalam variabel dependen Anda yang berkorelasi sepanjang waktu. Secara umum, ketika bekerja dengan data deret waktu, biasanya aman untuk mengasumsikan korelasi serial temporal dalam istilah kesalahan dalam grup Anda. Situasi ini adalah kasus penggunaan yang paling jelas untuk UK yang berkerumun.
Beberapa contoh ilustrasi:
Jika Anda memiliki data eksperimental tempat Anda menetapkan perawatan secara acak, tetapi melakukan pengamatan berulang untuk setiap individu / kelompok dari waktu ke waktu, Anda akan dibenarkan dalam menghilangkan efek tetap, tetapi ingin mengelompokkan UK Anda.
Atau, jika Anda memiliki banyak pengamatan per kelompok untuk data non-eksperimental, tetapi setiap pengamatan dalam-kelompok dapat dianggap sebagai imbang menarik dari kelompok mereka yang lebih besar (misalnya, Anda memiliki pengamatan dari banyak sekolah, tetapi setiap kelompok adalah himpunan bagian yang diambil secara acak. siswa dari sekolah mereka), Anda ingin memasukkan efek tetap tetapi tidak perlu UK yang terkelompok.
sumber
Jawaban ini baik-baik saja, tetapi jawaban terbaru dan terbaik diberikan oleh Abadie et al. (2019) "Kapan Anda Harus Menyesuaikan Kesalahan Standar untuk Clustering?" Dengan efek tetap, alasan utama untuk bergerombol adalah Anda memiliki heterogenitas dalam efek pengobatan di seluruh kluster. Ada alasan lain, misalnya jika cluster (misalnya perusahaan, negara) adalah bagian dari cluster dalam populasi (yang Anda simpulkan). Clustering adalah masalah desain adalah pesan utama dari makalah ini. Jangan lakukan itu secara membabi buta.
sumber