Perbedaan antara variabel yang benar-benar acak (yang harus dimodelkan seperti itu) dan variabel non-acak yang beberapa orang berpendapat dapat dimodelkan sebagai acak jika itu adalah model hierarkis / bertingkat, menjadi buram bagi saya.
Bates dan Bolker mencontohkan efek acak dengan kasus keacakan benar, misalnya kualitas produk dalam sampel yang dipilih secara acak. Meskipun lme4
pekerjaan mereka luar biasa, masih agak tidak jelas di mana garis antara acak dan tidak acak. Diskusi dalam ilmu sosial membuat ini lebih buram. Multilevel / model hierarkis dan model efek acak secara komputasi sama lme4
, jadi di mana kita menggambar garis?
Sebagai contoh, saya memiliki kumpulan data dengan ukuran berulang pada beberapa individu (itu acak!) Tapi saya percaya, dan hasil dari lme4
pertunjukan, bahwa sebagian besar varian terletak di dalam variabel sosial ekonomi mereka (seperti bidang kehidupan, ras, dll). Variabel-variabel ini tidak acak, tetapi model multilevel berpendapat bahwa ini dapat digunakan seperti itu. Contoh-contoh lain datang dari studi nilai-nilai siswa, biasanya siswa bersarang di dalam guru dan lebih jauh di sekolah. Semua variabel ini konstan.
Bisakah kita memodelkan faktor-faktor non acak sebagai acak jika masuk akal dalam ranah model multilevel (hierarkis)?
sumber
Jawaban:
Saya bingung dengan pertanyaan Anda. Saya tahu Anda mengatakan Anda memahami efek tetap vs acak, tetapi mungkin Anda tidak memahaminya dengan cara yang sama seperti saya. Saya telah memposting kutipan agak panjang dari bab buku in-press di sini yang menjelaskan pandangan saya (agak pragmatis, cukup selaras dengan Andrew Gelman).
Lebih langsung menjawab pertanyaan:
Mungkin menambah kejelasan untuk membedakan antara variabel pengelompokan (yang harus kategorikal), yang mewakili kelompok-kelompok di mana hal-hal berbeda, dan efek , yang merupakan perbedaan dalam beberapa parameter / efek (biasanya mencegat, tetapi bisa menjadi efek pendapatan / pendidikan / apa pun) lintas level beberapa variabel pengelompokan.
pembaruan : Saya akan mengambil kebebasan memberikan tandingan kepada Anda
Saya tidak yakin apa artinya ini. Anda tahu dari lingkungan mana setiap observasi berasal, bukan? Bagaimana itu "tidak teramati"? (Jika Anda mencurigai mengelompokkan data Anda berdasarkan teramati faktor Anda akan perlu untuk menyesuaikan model mixture diskrit .) Jika Anda berarti bahwa Anda tidak tahu mengapa lingkungan yang berbeda, saya tidak berpikir bahwa hal-hal di sini.
Satu-satunya alasan saya bisa memikirkan untuk tidak menggunakan lingkungan sebagai efek acak adalah jika Anda hanya mengukur sejumlah kecil (katakanlah <6) dari lingkungan.
sumber