Perbedaan antara data panel & model campuran

14

Saya ingin tahu perbedaan antara analisis data panel & analisis model campuran. Sepengetahuan saya, baik data panel & model campuran menggunakan efek tetap & acak. Jika demikian, mengapa mereka memiliki nama yang berbeda? Atau apakah mereka identik?

Saya telah membaca posting berikut, yang menjelaskan definisi efek tetap, acak & campuran, tetapi tidak menjawab pertanyaan saya: Apa perbedaan antara model efek tetap, efek acak dan campuran?

Saya juga akan berterima kasih jika seseorang dapat merujuk saya ke referensi singkat (sekitar 200 halaman) tentang analisis model campuran. Sebagai tambahan, saya lebih suka referensi pemodelan campuran terlepas dari perlakuan perangkat lunak. Terutama penjelasan teoritis tentang pemodelan campuran.

Beta
sumber
Terkait: stats.stackexchange.com/questions/238214
amoeba mengatakan Reinstate Monica

Jawaban:

22

Baik data panel dan data model efek campuran berhubungan dengan variabel acak indeks ganda . Indeks pertama adalah untuk grup, yang kedua adalah untuk individu dalam grup. Untuk data panel, indeks kedua biasanya waktu, dan diasumsikan bahwa kita mengamati individu dari waktu ke waktu. Ketika waktu adalah indeks kedua untuk model efek campuran, model-model tersebut disebut model longitudinal. Model efek campuran paling baik dipahami dalam hal regresi 2 level. (Untuk kemudahan eksposisi asumsikan hanya satu variabel penjelas)yij

Regresi tingkat pertama adalah sebagai berikut

yij=αi+xijβi+εij.

Ini hanya dijelaskan sebagai regresi individu untuk setiap kelompok. Regresi tingkat kedua mencoba menjelaskan variasi dalam koefisien regresi:

β i = δ 0 + z i 2 δ 1 + v i

αi=γ0+zi1γ1+ui
βi=δ0+zi2δ1+vi

Ketika Anda mengganti persamaan kedua dengan yang pertama Anda dapatkan

yij=γ0+zi1γ1+xijδ0+xijzi2δ1+ui+xijvi+εij

Efek tetap adalah apa yang diperbaiki, ini berarti . Efek acak adalah dan .u i v iγ0,γ1,δ0,δ1uivi

Sekarang untuk data panel terminologi berubah, tetapi Anda masih dapat menemukan titik-titik umum. Model efek acak data panel sama dengan model efek campuran

β i = δ 0

αi=γ0+ui
βi=δ0

dengan model karena

yit=γ0+xitδ0+ui+εit,

di mana adalah efek acak.ui

Perbedaan paling penting antara model efek campuran dan model data panel adalah pengobatan regressor . Untuk model efek campuran mereka adalah variabel non-acak, sedangkan untuk model data panel selalu diasumsikan bahwa mereka adalah variabel acak. Ini menjadi penting ketika menyatakan apa model efek tetap untuk data panel.xij

Untuk model efek campuran, diasumsikan bahwa efek acak dan tidak tergantung pada dan juga dari dan , yang selalu benar ketika dan diperbaiki. Jika kita mengizinkan untuk stochastic ini menjadi penting. Jadi model efek acak untuk data panel mengasumsikan bahwa tidak berkorelasi dengan . Namun model fixed effect yang memiliki bentuk yang samav i ε i j x i j z i x i j z i x i j x i t u iuiviεijxijzixijzixijxitui

yit=γ0+xitδ0+ui+εit,

memungkinkan korelasi dan . Penekanannya adalah semata-mata untuk memperkirakan secara konsisten . Ini dilakukan dengan mengurangi cara individu: u i δ 0xituiδ0

yity¯i.=(xitx¯i.)δ0+εitε¯i.,

dan menggunakan OLS sederhana untuk menghasilkan masalah regresi. Secara aljabar ini bertepatan dengan masalah regresi variabel dummy kuadrat terkecil, di mana kita mengasumsikan bahwa adalah parameter tetap. Oleh karena itu nama model efek tetap.ui

Ada banyak sejarah di balik terminologi efek tetap dan efek acak dalam ekonometrik data panel, yang saya hilangkan. Menurut pendapat pribadi saya, model-model ini paling baik dijelaskan dalam " analisis ekonometrik penampang dan data panel Wooldridge ". Sejauh yang saya tahu tidak ada sejarah dalam model efek campuran, tetapi di sisi lain saya berasal dari latar belakang ekonometrik, jadi saya mungkin salah.

mpiktas
sumber
Ketika Anda mengganti (2) dan (3) menjadi (1), saya pikir ada sesuatu yang hancur. Saya percaya itu harus kecuali saya kehilangan sesuatu. ...+xijvi+ui+εij
Dimitriy V. Masterov
Penjelasan ini luar biasa! Terima kasih banyak untuk mengambil semua upaya untuk memberi saya eksposisi yang luar biasa. Hanya ingin bertanya satu hal. Apa yang Anda maksud dengan regresi 2 level?
Beta
2
@ Ari, regresi tingkat kedua adalah regresi untuk koefisien regresi regresi tingkat pertama. Regresi tingkat pertama mencoba menjelaskan variasi dalam kelompok, sedangkan regresi tingkat kedua mencoba menjelaskan variasi antar kelompok. Divisi ini adalah buatan, tetapi saya menyukainya karena setidaknya terasa alami bagi saya. Jenis pembagian ini juga digunakan dalam model Bayes hirarkis.
mpiktas
Ini adalah jawaban yang sangat bagus, +1 dulu. Satu-satunya hal yang saya temukan hilang di sini adalah beberapa diskusi tentang bagaimana koefisien dari "model efek acak" dalam ekonometrik diperkirakan. Anda menjelaskannya untuk "model efek tetap", tetapi jangan mengomentari yang acak. Saya akan sangat menghargai jika Anda dapat menambahkan sesuatu tentang itu. δ0
Amoeba berkata Reinstate Monica
3

Saya mengerti Anda sedang mencari teks yang menjelaskan teori pemodelan campuran tanpa referensi ke paket perangkat lunak.

Saya akan merekomendasikan Analisis Multilevel, Pengantar pemodelan multilevel dasar dan lanjutan oleh Tom Snijders dan Roel Bosker, sekitar 250pp. Ini memiliki bab tentang perangkat lunak pada akhirnya (yang agak ketinggalan zaman sekarang) tetapi sisanya adalah teori yang sangat mudah didekati.

Saya harus mengatakan bahwa saya setuju dengan rekomendasi di atas untuk Model Multilevel dan Longitudinal Using Stata oleh Sophia Rabe-Hesketh dan Anders Skrondal. Buku ini sangat teoretis dan komponen perangkat lunaknya benar-benar hanya tambahan yang bagus untuk teks yang substansial. Saya biasanya tidak menggunakan Stata dan menempatkan teks di meja saya dan menemukan itu ditulis dengan sangat baik. Namun itu jauh lebih lama dari 200pp.

Teks-teks berikut semuanya ditulis oleh para ahli saat ini di lapangan dan akan berguna bagi siapa pun yang menginginkan informasi lebih lanjut tentang teknik-teknik ini (walaupun mereka tidak secara khusus sesuai dengan permintaan Anda): [Saya tidak dapat menautkan ini karena saya seorang yang baru pengguna, maaf]

Hoox, Joop (2010). Analisis Bertingkat, Teknik dan Aplikasi.

Gelman, A., dan Hill, J. (2006) Analisis Data Menggunakan Regresi dan Model Multilevel / Hirarki.

Singer, J. (2003) Analisis Data Longitudinal Terapan: Pemodelan Perubahan dan Kejadian Acara

Raudenbush, SW, dan Bryk, A., S. (2002). Hierarchical Linear Models: Aplikasi dan metode analisis data

Luke, Douglas, (2004). Pemodelan Bertingkat

Saya juga ingin teks kedua Wooldridge yang disebutkan di atas, serta teks R, dan B ristol University Center for Multilevel Modelling memiliki banyak tutorial dan informasi

mainitagain
sumber
Terima kasih Playitagain! Informasi ini sangat berguna. Bahkan namamu menarik :)
Beta
2

Saya juga bertanya-tanya tentang perbedaan antara keduanya dan baru-baru ini menemukan referensi tentang topik ini, saya mengerti bahwa "data panel" adalah nama tradisional untuk kumpulan data yang mewakili "bagian melintang atau sekelompok orang yang disurvei secara berkala melalui rentang waktu yang diberikan ". Jadi "panel" adalah struktur grup dalam dataset, dan memiliki grup seperti itu cara paling alami untuk menganalisis tipe data ini adalah melalui pendekatan pemodelan campuran.

Referensi yang baik (terlepas apakah Anda "berbicara" R atau tidak) pada pemodelan efek campuran adalah konsep buku (?) Yang akan datang karya Douglas Bates ( lme4: Pemodelan efek campuran dengan R ).

ils
sumber
1
Terima kasih ils untuk referensi! Tapi masalahnya masih ada.
Beta
2

@mpiktas telah memberikan jawaban yang menyeluruh. Saya juga menyarankan membaca Bab 7 dari dokumentasi untuk paket PLM di R . Diskusi penulis tentang perbedaan antara model campuran dan data panel layak dibaca.

Karthik
sumber
1

Jika Anda menggunakan Stata, Multilevel , dan Longitudinal Model Menggunakan Stata oleh Sophia Rabe-Hesketh dan Anders Skrondal akan menjadi pilihan yang baik. Bergantung pada apa yang Anda minati, 200 halaman mungkin benar.

Dimitriy V. Masterov
sumber
Terima kasih Dimitriy untuk referensi. Tapi sayangnya saya tidak menggunakan STATA. Saya terutama menggunakan SAS, & kadang-kadang R. Tapi terima kasih.
Beta
2
Saya telah mendengar hal-hal baik tentang wiley.com/WileyCDA/WileyTitle/productCd-0470073713.html , tetapi saya belum membacanya sendiri.
Dimitriy V. Masterov
Terima kasih Dimitriy! Ini terlihat sangat menjanjikan. Keuntungan mengajukan pertanyaan daripada goggling adalah Anda mendapatkan hasil yang sangat bagus :)
Beta
1

Dalam pengalaman saya, alasan untuk menggunakan 'panel econometrics' adalah bahwa penaksir 'efek tetap' panel dapat digunakan untuk mengontrol berbagai bentuk bias variabel yang dihilangkan.

Namun, dimungkinkan untuk melakukan jenis estimasi ini dalam model bertingkat menggunakan pendekatan tipe Mundlak , yaitu termasuk sarana kelompok sebagai regressor tambahan. Pendekatan ini menghilangkan korelasi antara istilah kesalahan dan faktor-faktor yang dihilangkan pada tingkat kelompok potensial, mengungkapkan koefisien 'dalam'. Namun, untuk alasan yang tidak saya ketahui, ini biasanya tidak dilakukan dalam penelitian terapan. Ini slide dan ini dokumen memberikan elaborasi.

EddieMcGoldrick
sumber
(+1) Sosiolog sering menafsirkan makna kelompok sebagai efek kontekstual (walaupun ini lebih sering untuk data cross-sectional bersarang daripada untuk data panel seri waktu). Saya perlu membaca, dari catatan terkait Manski (1993) ( PDF di sini ) memiliki artikel yang menunjukkan bagaimana efek kontekstual seperti itu sering tidak teridentifikasi. Untuk "alasan ini tidak dilakukan" Saya curiga ada banyak perbedaan antara praktik ilmu sosial dengan apa pun, mungkin itu pertanyaan yang bagus untuk ditanyakan.
Andy W