Bisakah efek acak hanya berlaku untuk variabel kategori?

9

Pertanyaan ini mungkin terdengar bodoh, tetapi ... apakah benar bahwa efek acak hanya dapat berlaku untuk variabel kategori (seperti id individu, id populasi, ...), misalkan katakanlah adalah variabel kategori:xi

yi ~βxi

βxi ~Norm(μ,δ2)

tetapi dari prinsipnya efek acak tidak dapat berlaku untuk variabel kontinu (seperti tinggi, massa ...), katakan :zi

yi ~α+βzi

karena dengan demikian hanya ada satu koefisien yang tidak dapat dibatasi? Kedengarannya logis tetapi saya bertanya-tanya mengapa itu tidak pernah disebutkan dalam literatur statistik! Terima kasih!β

EDIT: Tapi bagaimana jika saya membatasi seperti ~ ? Apakah itu efek acak? Tapi ini berbeda dari batasan yang saya pakai pada - di sini saya membatasi variabel sedangkan pada contoh sebelumnya saya membatasi koefisien ! Itu mulai terlihat sebagai kekacauan besar bagi saya ... Pokoknya, tidak masuk akal untuk menempatkan batasan ini, karena adalah nilai yang diketahui, jadi mungkin ide ini benar-benar aneh :-)z i N o r m ( μ , δ 2 ) β x iziziNorm(μ,δ2)βxizi

Ingin tahu
sumber
1
Pertanyaan terkait yang menarik: stats.stackexchange.com/q/61531/5509
Curious

Jawaban:

5

Ini adalah pertanyaan yang bagus dan sangat mendasar.

Penafsiran efek acak sangat spesifik-domain dan tergantung pada pilihan pemodelan (model statistik atau menjadi Bayesian atau sering). Untuk diskusi yang sangat bagus, lihat halaman 245, Gelman dan Hill (2007) . Untuk Bayesian semuanya acak (meskipun parameter mungkin memiliki nilai tetap yang benar, mereka dimodelkan sebagai acak), dan frequentist juga dapat memilih nilai parameter untuk menjadi efek tetap yang seharusnya dimodelkan sebagai acak (lihat Casella, 2008 , diskusi tentang blok yang harus diperbaiki atau acak dalam contoh 3.2).

Edit (setelah komentar)

Data diperbaiki setelah Anda mengamatinya. Jika kontinu, mereka harus dimodelkan sebagai kontinu. Anda bisa memodelkan variabel kategori sebagai kategori dan kadang-kadang sebagai kontinu (seperti dalam pengaturan variabel ordinal). Parameter tidak diketahui dan mereka dapat dimodelkan sebagai tetap atau acak. Parameter dasarnya menghubungkan respons dengan prediktor. Jika Anda ingin kemiringan prediktor individual (atau koefisiennya dalam model linier) berbeda-beda untuk setiap respons, modelkan secara acak, jika tidak modelkan sebagai tetap. Demikian pula, jika Anda ingin intersep bervariasi mengenai kelompok, maka mereka harus dimodelkan sebagai acak; kalau tidak mereka harus diperbaiki.

suncoolsu
sumber
1
Terima kasih atas jawaban Anda, tapi hmmm .... Saya telah mengajukan pertanyaan sederhana dan mengharapkan jawaban yang sederhana atau umum :) dalam paragraf 2 Anda, Anda menyatakan bahwa dalam Bayesian semuanya acak. Tolong jangan terlalu menyulitkan :) Saya sengaja bertanya di tingkat model, tolong lupakan frequentist atau bayesian - Saya tertarik pada prinsip - untuk jenis variabel mana efek acak biasanya digunakan?
Penasaran
Pada paragraf ke-3 Anda meletakkan aplikasi khusus dengan deret waktu, saya tidak yakin saya memahaminya tetapi deret waktu AFAIK biasanya diskrit (tidak kontinu) jika Anda berbicara tentang korelasi serial ... Pokoknya, jika Anda memiliki cara yang lebih umum jawab, tolong bagikan. Sekali lagi, terima kasih atas jawabannya!
Penasaran
Keacakan dalam hal-hal yang tidak diketahui. Ketika Anda memiliki pengamatan mereka dikenal! Satu-satunya hal yang Anda ketahui adalah data Anda. Yang tidak diketahui adalah parameter dan mereka dapat dimodelkan sebagai acak atau tetap. (maaf atas kebingungannya; saya setuju, saya tidak perlu membuat segalanya menjadi rumit.)
suncoolsu
terima kasih telah menyederhanakan jawaban Anda. Jadi datang ke akar pertanyaan saya - jadi apakah ini berarti jawabannya adalah ya , yaitu efek acak hanya berlaku untuk variabel kategori, karena efek acak hanya berlaku untuk parameter (bukan data), dan satu-satunya parameter yang dapat dimodelkan secara acak adalah mereka yang memiliki beberapa level, yaitu variabel yang bersifat kategori? Dan parameter variabel kontinu tidak dapat dimodelkan sebagai acak, karena hanya ada 1 nilai parameter untuk variabel kontinu? Terima kasih!
Penasaran
Dalam pengaturan spesifik Anda, jawabannya adalah YA . Tetapi secara umum jawabannya, saya akan mengatakan, adalah TIDAK karena variabel kontinu dapat bervariasi sesuai dengan kelompok. Misalnya, pendapatan penduduk di kota harus lebih tinggi daripada desa (menurut Anda ini mungkin dua variabel kategori terpisah untuk lokasi).
suncoolsu
3

Pertanyaan Anda mungkin sudah dipecahkan, tetapi sebenarnya ditulis dalam buku teks;

Efek acak adalah variabel kategori yang levelnya dipandang sebagai sampel dari beberapa populasi yang lebih besar, sebagai kebalikan dari efek tetap, yang levelnya menarik bagi hak mereka sendiri,

pada halaman 232 dari: Alan Grafen dan Rosie Hails (2002) "Statistik modern untuk ilmu kehidupan", Oxford University Press.

sapporo
sumber
2
Ini semua benar, tetapi saya tidak berpikir ini menjawab pertanyaan.
Patrick Coulombe
1
Saya tidak setuju dengan komentar di atas oleh @PatrickCoulombe, saya pikir ini justru menjawab pertanyaan. +1.
amoeba
1

Saya pikir masalahnya adalah ada dua hal yang terlibat di sini. Contoh khas dari efek acak mungkin memprediksi nilai rata-rata (IPK) seorang mahasiswa berdasarkan sejumlah faktor termasuk skor rata-rata mereka dalam serangkaian tes selama sekolah menengah.

Skor rata-rata kontinu . Anda biasanya memiliki intersep yang bervariasi, atau intersep dan kemiringan, untuk skor rata-rata untuk setiap individu. Individu jelas kategoris .

Jadi, ketika Anda mengatakan "hanya berlaku untuk variabel kategori" itu agak kabur. Katakanlah Anda hanya mempertimbangkan intersepsi acak untuk skor rata-rata. Dalam hal ini, intersep acak Anda untuk kuantitas kontinu dan pada kenyataannya mungkin dimodelkan sebagai sesuatu seperti variabel gaussian dengan mean dan standar deviasi yang akan ditentukan oleh prosedur. Tetapi intersepsi acak ini ditentukan pada populasi siswa di mana setiap siswa diidentifikasi oleh variabel kategori.

Anda bisa menggunakan variabel "berkelanjutan" sebagai ganti ID siswa. Mungkin Anda bisa memilih tinggi siswa. Tetapi pada dasarnya harus diperlakukan seolah-olah itu kategoris. Jika pengukuran tinggi badan Anda sangat tepat, Anda akan kembali dengan ketinggian yang unik untuk setiap siswa sehingga tidak ada yang berbeda. Jika pengukuran tinggi badan Anda tidak terlalu tepat, Anda akhirnya akan menyamakan banyak siswa pada setiap ketinggian. (Mencampur skor mereka dengan cara yang mungkin tidak jelas.)

Ini adalah semacam kebalikan dari interaksi. Dalam interaksi, Anda mengalikan dua variabel dan pada dasarnya memperlakukan keduanya sebagai kontinu. Variabel kategorikal akan dipecah menjadi seperangkat variabel dummy 0/1 dan 0 atau 1 akan dikalikan kali variabel lain dalam interaksi.

Intinya adalah bahwa "efek acak" dalam arti tertentu hanya koefisien yang memiliki distribusi (dimodelkan) daripada nilai tetap.

Wayne
sumber
Silakan masuk di bawah akun utama Anda untuk dapat mengedit.
amoeba