Bisakah kita memodelkan faktor-faktor non acak sebagai acak dalam desain bertingkat / hierarkis?

Perbedaan antara variabel yang benar-benar acak (yang harus dimodelkan seperti itu) dan variabel non-acak yang beberapa orang berpendapat dapat dimodelkan sebagai acak jika itu adalah model hierarkis / bertingkat, menjadi buram bagi saya.

Bates dan Bolker mencontohkan efek acak dengan kasus keacakan benar, misalnya kualitas produk dalam sampel yang dipilih secara acak. Meskipun lme4pekerjaan mereka luar biasa, masih agak tidak jelas di mana garis antara acak dan tidak acak. Diskusi dalam ilmu sosial membuat ini lebih buram. Multilevel / model hierarkis dan model efek acak secara komputasi sama lme4, jadi di mana kita menggambar garis?

Sebagai contoh, saya memiliki kumpulan data dengan ukuran berulang pada beberapa individu (itu acak!) Tapi saya percaya, dan hasil dari lme4pertunjukan, bahwa sebagian besar varian terletak di dalam variabel sosial ekonomi mereka (seperti bidang kehidupan, ras, dll). Variabel-variabel ini tidak acak, tetapi model multilevel berpendapat bahwa ini dapat digunakan seperti itu. Contoh-contoh lain datang dari studi nilai-nilai siswa, biasanya siswa bersarang di dalam guru dan lebih jauh di sekolah. Semua variabel ini konstan.

Bisakah kita memodelkan faktor-faktor non acak sebagai acak jika masuk akal dalam ranah model multilevel (hierarkis)?

random-effects-model mixed-model Adam Robinsson
sumber

Lihat di sini: stats.stackexchange.com/questions/4700/…

Tim

Dan di sini: stats.stackexchange.com/questions/26230/...

Tim

Hai Tim. Terima kasih atas tautannya tetapi mereka tidak akan menjawab pertanyaan itu. Saya mengerti arti efek acak, campuran dan tetap. Pertanyaan ini adalah apakah desain multilevel / hieararchical memungkinkan penggabungan variabel non-acak sebagai acak.

Adam Robinsson

Saya bingung dengan pertanyaan Anda. Saya tahu Anda mengatakan Anda memahami efek tetap vs acak, tetapi mungkin Anda tidak memahaminya dengan cara yang sama seperti saya. Saya telah memposting kutipan agak panjang dari bab buku in-press di sini yang menjelaskan pandangan saya (agak pragmatis, cukup selaras dengan Andrew Gelman).

Lebih langsung menjawab pertanyaan:

itu tidak (IMO) masuk akal untuk memasukkan efek utama dari variabel sosial ekonomi seperti pendapatan sebagai acak. Jika Anda memiliki lebih dari satu pengukuran pendapatan per individu, Anda dapat memasukkan individu sebagai variabel pengelompokan dan memungkinkan efek pendapatan pada respons (apa pun itu) bervariasi di setiap individu.
Ras tampaknya paling masuk akal sebagai efek tetap, dan sepertinya Anda tidak akan dapat mengukur individu di bawah pengaruh lebih dari satu ras, tetapi Anda mungkin (misalnya) dapat mengkarakterisasi variasi acak dalam efek. ras di berbagai negara. Anda bisa memperlakukannya sebagai efek acak (yaitu perbedaan model antar ras sebagai diambil dari distribusi Normal), tetapi kemungkinan tidak praktis karena Anda mungkin tidak akan memiliki cukup ras yang berbeda dalam kumpulan data Anda, dan itu akan sulit untuk saya datang dengan argumen konseptual yang baik untuk ini ...
"area kehidupan" masuk akal sebagai variabel pengelompokan, yang tentunya bisa menjadi efek acak yang masuk akal (yaitu intersep akan bervariasi di seluruh area hidup). Individu mungkin akan bersarang di dalam area, kecuali jika individu bergerak di antara area dalam skala waktu studi Anda.
situasi Anda tampaknya menjadi kasus di mana Anda memiliki beberapa variasi acak di antara individu, tetapi Anda juga memiliki kovariat tingkat individu. Menambahkan kovariat tingkat individu ini (ras, pendapatan, dll.) Ke model akan menjelaskan beberapa variabilitas di antara individu (dan mungkin ide yang bagus).

Mungkin menambah kejelasan untuk membedakan antara variabel pengelompokan (yang harus kategorikal), yang mewakili kelompok-kelompok di mana hal-hal berbeda, dan efek , yang merupakan perbedaan dalam beberapa parameter / efek (biasanya mencegat, tetapi bisa menjadi efek pendapatan / pendidikan / apa pun) lintas level beberapa variabel pengelompokan.

pembaruan : Saya akan mengambil kebebasan memberikan tandingan kepada Anda

Pemahaman saya tentang efek acak: faktor-faktor yang dipilih secara acak dari suatu populasi;

Mungkin, itu tergantung pada pandangan filosofis Anda. Ini adalah diperlukan dalam paradigma frequentist klasik, tapi saya akan bersantai agak dengan menanyakan apakah itu wajar untuk mengobati efek sebagai random menarik dari beberapa populasi hipotetis. (Contoh klasik di sini adalah (1) pengambilan sampel lengkap (bagaimana jika Anda memiliki pengukuran untuk setiap lingkungan di kota, atau setiap wilayah / provinsi / negara bagian di suatu negara? Bisakah Anda masih memperlakukannya sebagai penarikan acak dari beberapa populasi super?) Dan (2) ) periode waktu diukur secara berurutan (misalnya tahun 2002-2012) .Dalam kedua kasus ini saya akan mengatakan itu masuk akal secara pragmatis untuk memodelkan mereka menggunakan efek acak.)

tingkat faktor ini kurang menarik;

belum tentu. Saya tidak berpikir ide bahwa efek acak harus menjadi variabel gangguan dalam praktik. Misalnya, dalam analisis pemuliaan hewan, seseorang mungkin sangat tertarik untuk mengetahui nilai pemuliaan (BLUP) dari hewan tertentu. ( Tingkat fokus yang disebut memang memiliki beberapa implikasi untuk bagaimana seseorang membandingkan model.)

variabel adalah faktor yang tidak teramati.

Saya tidak yakin apa artinya ini. Anda tahu dari lingkungan mana setiap observasi berasal, bukan? Bagaimana itu "tidak teramati"? (Jika Anda mencurigai mengelompokkan data Anda berdasarkan teramati faktor Anda akan perlu untuk menyesuaikan model mixture diskrit .) Jika Anda berarti bahwa Anda tidak tahu mengapa lingkungan yang berbeda, saya tidak berpikir bahwa hal-hal di sini.

Jadi ambil lingkungan sebagai contoh. Ini adalah variabel yang saya minati, levelnya penting. Saya menggunakan model campuran dan memverifikasi bahwa ada banyak varian di dalamnya.

Satu-satunya alasan saya bisa memikirkan untuk tidak menggunakan lingkungan sebagai efek acak adalah jika Anda hanya mengukur sejumlah kecil (katakanlah <6) dari lingkungan.

Ben Bolker
sumber

Pemahaman saya tentang efek acak: faktor-faktor yang dipilih secara acak dari suatu populasi; tingkat faktor ini kurang menarik; variabel adalah faktor yang tidak teramati. Jadi ambil lingkungan sebagai contoh. Ini adalah variabel yang saya minati, levelnya penting. Saya menggunakan model campuran dan memverifikasi bahwa ada banyak varian di dalamnya. Anda mencatat bahwa itu dapat digunakan sebagai variabel acak. Jadi saya memodelkan variabel non-acak sebagai acak; ini agak membingungkan bagi saya tetapi jawaban Anda menjelaskan ini. Saya akan membaca kutipannya segera. Terima kasih atas jawabannya, hargai waktu Anda.

Adam Robinsson

Sayangnya saya tidak melihat pembaruan Anda sampai sekarang prof Bolker. Aku benar-benar berpikir aku dapat memegangnya sekarang. Ini bukan hal yang supersimple, seluruh konsep model campuran dan saya pikir mungkin perlu waktu untuk dipahami. Memang ada banyak pertanyaan serupa jadi saya kira saya bukan satu-satunya. Namun demikian, terima kasih atas jawaban yang jelas. Dihargai

Adam Robinsson

Bisakah kita memodelkan faktor-faktor non acak sebagai acak dalam desain bertingkat / hierarkis?

Jawaban: