Kapan harus menggunakan efek tetap vs menggunakan kluster SE?

19

Misalkan Anda memiliki satu bagian penampang data di mana individu berada di dalam kelompok (misalnya siswa di sekolah) dan Anda ingin memperkirakan model bentuk di Y_i = a + B*X_imana Xmerupakan vektor karakteristik tingkat individu dan akonstanta.

Dalam hal ini, anggaplah bias heterogenitas antar-kelompok yang tidak terobservasi dari estimasi poin Anda Bdan SE mereka karena itu berkorelasi dengan variabel bebas minat Anda.

Salah satu opsi adalah untuk mengelompokkan UK Anda berdasarkan kelompok (sekolah). Lain adalah memasukkan FE kelompok. Lain adalah menggunakan keduanya. Apa yang harus dipertimbangkan ketika memilih antara opsi-opsi ini? Secara khusus tidak jelas mengapa seseorang dapat mengelompokkan SE berdasarkan kelompok DAN menggunakan kelompok FE. Dalam kasus spesifik saya, saya memiliki 35 grup dan 5.000 individu yang bersarang di dalam setiap grup. Saya telah mengikuti diskusi di pdf ini , tetapi tidak terlalu jelas tentang mengapa dan kapan seseorang dapat menggunakan kedua S yang berkerumun dan efek tetap.

(Tolong diskusikan pro dan kontra dari SEs yang berkelompok vs FE daripada menyarankan saya hanya cocok dengan model bertingkat).

Tanya Jawab
sumber

Jawaban:

22

Kedua pendekatan, menggunakan efek tetap grup dan / atau kesalahan standar yang disesuaikan dengan kluster mempertimbangkan isu-isu berbeda yang terkait dengan data yang dikelompokkan (atau panel) dan saya akan dengan jelas melihatnya sebagai pendekatan yang berbeda. Seringkali Anda ingin menggunakan keduanya:

Pertama-tama, akun standar kesalahan yang disesuaikan dengan kluster untuk korelasi di dalam klaster atau heteroskedastisitas yang tidak diperhitungkan oleh penaksir efek tetap kecuali Anda bersedia membuat asumsi lebih lanjut, lihat slide kuliah Imbens dan Wooldridge untuk diskusi singkat yang singkat. dan panel panjang dan berbagai masalah yang berkaitan dengan masalah ini . Ada juga sebuah makalah baru tentang topik ini oleh Cameron dan Miller: Panduan Praktisi untuk Inferensi Cluster-Robust yang mungkin menarik bagi Anda. Jika Anda tidak ingin memodelkan matriks varians-kovarians dan Anda menduga ada korelasi dalam-cluster, saya menyarankan untuk menggunakan kesalahan standar robust cluster karena bias di SE Anda mungkin parah (jauh lebih bermasalah daripada untuk heteroskedastisitas, lihatAngrist & Pischke Bab III.8 untuk diskusi tentang topik ini. Tetapi Anda membutuhkan cukup banyak cluster (Angrist dan Pischke mengatakan 40-50 sebagai peran praktis). Kesalahan standar yang disesuaikan dengan klaster memperhitungkan kesalahan standar akun tetapi membiarkan estimasi poin Anda tidak berubah (kesalahan standar biasanya akan naik)!

Estimasi efek tetap memperhitungkan heterogenitas invarian-waktu yang tidak teramati (seperti yang Anda sebutkan). Ini bisa baik atau buruk: Di tangan, Anda perlu lebih sedikit asumsi untuk mendapatkan estimasi yang konsisten. Di sisi lain, Anda membuang banyak varian yang mungkin berguna. Beberapa orang seperti Andrew Gelman lebih suka pemodelan hierarkis untuk efek tetap tetapi di sini pendapat berbeda. Estimasi efek tetap akan mengubah estimasi titik dan interval (juga di sini kesalahan standar biasanya akan lebih tinggi).

Jadi kesimpulannya: Kesalahan standar Cluster-robust adalah cara mudah untuk memperhitungkan kemungkinan masalah yang terkait dengan data cluster jika Anda tidak ingin repot dengan pemodelan korelasi antar dan intra-cluster (dan ada cukup cluster yang tersedia). Estimasi efek tetap hanya akan menggunakan variasi tertentu, jadi itu tergantung pada model Anda apakah Anda ingin membuat estimasi berdasarkan variasi yang lebih sedikit atau tidak. Tetapi tanpa asumsi lebih lanjut, estimasi efek tetap tidak akan menangani masalah yang terkait dengan korelasi intra-cluster untuk matriks varians. Cluster-robust standard error tidak akan memperhitungkan masalah akun yang terkait dengan penggunaan estimasi efek tetap.

Arne Jonas Warnke
sumber
2
Respon yang bagus Pertanyaan utama yang tersisa adalah mengapa seseorang menginginkan KEDUA. Imbens dan Wooldridge membahas hal ini sampai batas tertentu.
QuestionAnswer
13

Efek tetap adalah untuk menghapus heterogenitas yang tidak teramati ANTARA berbagai kelompok dalam data Anda.

Saya tidak setuju dengan implikasi dalam respons yang diterima bahwa keputusan untuk menggunakan model FE akan tergantung pada apakah Anda ingin menggunakan "variasi kurang atau tidak". Jika variabel dependen Anda dipengaruhi oleh variabel yang tidak dapat diobservasi yang secara sistematis bervariasi antar kelompok di panel Anda, maka koefisien pada variabel apa pun yang berkorelasi dengan variasi ini akan menjadi bias. Kecuali jika variabel X Anda telah ditetapkan secara acak (dan mereka tidak akan pernah dengan data observasi), biasanya cukup mudah untuk membuat argumen untuk variabel yang dihilangkan bias. Kamu mungkindapat mengontrol beberapa variabel yang dihilangkan dengan daftar variabel kontrol yang baik, tetapi jika identifikasi yang kuat adalah tujuan nomor 1 Anda, bahkan daftar kontrol yang luas dapat memberikan ruang bagi pembaca kritis untuk meragukan hasil Anda. Dalam kasus ini, biasanya merupakan ide yang baik untuk menggunakan model efek tetap.

Kesalahan standar yang dikelompokkan untuk akuntansi untuk situasi di mana pengamatan DALAM SETIAP kelompok tidak iid (didistribusikan secara independen dan identik).

Contoh klasik adalah jika Anda memiliki banyak pengamatan untuk panel perusahaan sepanjang waktu. Anda dapat memperhitungkan efek tetap tingkat perusahaan, tetapi mungkin masih ada beberapa variasi yang tidak dapat dijelaskan dalam variabel dependen Anda yang berkorelasi sepanjang waktu. Secara umum, ketika bekerja dengan data deret waktu, biasanya aman untuk mengasumsikan korelasi serial temporal dalam istilah kesalahan dalam grup Anda. Situasi ini adalah kasus penggunaan yang paling jelas untuk UK yang berkerumun.

Beberapa contoh ilustrasi:

Jika Anda memiliki data eksperimental tempat Anda menetapkan perawatan secara acak, tetapi melakukan pengamatan berulang untuk setiap individu / kelompok dari waktu ke waktu, Anda akan dibenarkan dalam menghilangkan efek tetap, tetapi ingin mengelompokkan UK Anda.

Atau, jika Anda memiliki banyak pengamatan per kelompok untuk data non-eksperimental, tetapi setiap pengamatan dalam-kelompok dapat dianggap sebagai imbang menarik dari kelompok mereka yang lebih besar (misalnya, Anda memiliki pengamatan dari banyak sekolah, tetapi setiap kelompok adalah himpunan bagian yang diambil secara acak. siswa dari sekolah mereka), Anda ingin memasukkan efek tetap tetapi tidak perlu UK yang terkelompok.

Alex P. Miller
sumber
2

Jawaban ini baik-baik saja, tetapi jawaban terbaru dan terbaik diberikan oleh Abadie et al. (2019) "Kapan Anda Harus Menyesuaikan Kesalahan Standar untuk Clustering?" Dengan efek tetap, alasan utama untuk bergerombol adalah Anda memiliki heterogenitas dalam efek pengobatan di seluruh kluster. Ada alasan lain, misalnya jika cluster (misalnya perusahaan, negara) adalah bagian dari cluster dalam populasi (yang Anda simpulkan). Clustering adalah masalah desain adalah pesan utama dari makalah ini. Jangan lakukan itu secara membabi buta.

Kishore Gawande
sumber