Notasi untuk pemodelan bertingkat

10

Formula yang perlu ditentukan untuk pelatihan model bertingkat (menggunakan lmerdari lme4 Rperpustakaan) selalu membuat saya. Saya telah membaca banyak buku pelajaran dan tutorial, tetapi tidak pernah memahaminya dengan baik.

Jadi, inilah contoh dari tutorial ini yang ingin saya lihat dirumuskan dalam persamaan. Kami mencoba memodelkan frekuensi suara sebagai fungsi gender (perempuan memiliki suara bernada lebih tinggi daripada laki-laki pada umumnya) dan sikap orang (apakah ia menjawab dengan sopan atau tidak resmi) dalam skenario yang berbeda. Juga, seperti yang Anda lihat dari subjectkolom, setiap orang mengalami pengukuran beberapa kali.

> head(politeness, n=20)
   subject gender scenario attitude frequency
1       F1      F        1      pol     213.3
2       F1      F        1      inf     204.5
3       F1      F        2      pol     285.1
4       F1      F        2      inf     259.7
5       F1      F        3      pol     203.9
6       F1      F        3      inf     286.9
7       F1      F        4      pol     250.8
8       F1      F        4      inf     276.8
9       F1      F        5      pol     231.9
10      F1      F        5      inf     252.4
11      F1      F        6      pol     181.2
12      F1      F        6      inf     230.7
13      F1      F        7      inf     216.5
14      F1      F        7      pol     154.8
15      F3      F        1      pol     229.7
16      F3      F        1      inf     237.3
17      F3      F        2      pol     236.8
18      F3      F        2      inf     251.0
19      F3      F        3      pol     267.0
20      F3      F        3      inf     266.0

subject, genderdan attitudemerupakan faktor (dengan informaldan femaledianggap sebagai level dasar untuk attitudedan genderdalam persamaan di bawah). Sekarang, satu ide adalah untuk melatih model dengan intersep yang berbeda untuk masing-masing subjectdan scenario:

politeness.model=lmer(frequency ~ attitude + gender + 
 (1|subject) + (1|scenario), data=politeness)

Jika pemahaman saya tentang notasi benar, ini sesuai dengan:

poli+γpriaiyi=aj[i]1+ak[i]2+β attitudepoli+γ gendermalei

di mana menunjukkan titik data , menunjukkan tingkat grup untuk dan menunjukkan tingkat grup untuk untuk titik data . dan adalah indikator biner.i t h j [ i ] k [ i ] i t h pol laki-lakiiithj[i]subjectk[i]scenarioithattitudepolgendermale

Untuk memperkenalkan lereng acak untuk sikap, kita dapat menulis:

politeness.model = lmer(frequency ~ attitude + gender + 
 (1+attitude|subject) + (1+attitude|scenario), data=politeness)

Sekali lagi, jika pemahaman saya jelas, ini sesuai dengan:

pol i + γ yi=aj[i]1+ak[i]2+(βj[i]1+βk[i]2) attitudepoli+γ gendermalei

Sekarang, persamaan apa yang Rsesuai dengan perintah berikut ?

politeness.null = lmer(frequency ~ gender +
 (1+attitude|subject) +  (1+attitude|scenario), data=politeness)
abhinavkulkarni
sumber
1
bukan yang sangat masuk akal; kemiringan rata-rata populasi sehubungan dengan sikap diasumsikan nol ...
Ben Bolker
@ BenBolker: Hei, bisakah Anda menulisnya dalam bentuk persamaan? Apakah persamaan saya sebelumnya benar? Dalam model terakhir, saya masih melihat attitudesedang dikondisikan subjectdan scenario.
abhinavkulkarni

Jawaban:

12

saya akan menulis

~ attitude + gender + (1|subject) + (1|scenario)

sebagai

yiβ0+β1I(attitude=pol)+β2I(gender=male)+b1,j[i]+b2,k[i]+ϵib1N(0,σ12)b2N(0,σ22)ϵN(0,σr2)
mana menunjukkan koefisien efek tetap, menunjukkan variabel acak, adalah fungsi indikator (ini pada dasarnya sama dengan apa yang Anda katakan di atas, hanya notasi yang sedikit berbeda).βbI
~ attitude + gender + (1+attitude|subject) + (1+attitude|scenario)

menambahkan variasi di antara subjek dalam menanggapi attitudedan scenario(kita bisa menulis bagian efek-acak sebagai (attitude|subject) + (attitude|scenario), yaitu membiarkan intersep tersirat; ini masalah selera). Sekarang

Σ 1 Σ 2 Σ 1 = (

yiβ0+β1I(attitude=pol)+β2I(gender=male)+b1,j[i]+b3,j[i]I(attitude=pol)+b2,k[i]+b4,k[i]I(attitude=pol)+ϵi{b1,b3}MVN(0,Σ1){b2,b4}MVN(0,Σ2)ϵN(0,σr2)
mana dan adalah matriks varians-kovarian yang tidak terstruktur, yaitu mereka simetris dan positif (semi) pasti tetapi tidak memiliki kendala lain: dan demikian pula untuk .Σ1Σ2
Σ1=(σ12σ13σ13σ32)
Σ2

Mungkin bermanfaat untuk mengelompokkan istilah sebagai berikut: sehingga Anda dapat melihat efek acak mana yang memengaruhi intersep dan yang memengaruhi respons terhadap sikap.

yi(β0+b1,j[i]+b2,k[i])+(β1+b3,j[i]+b4,k[i])I(attitude=pol)+β2I(gender=male)+ϵi

Sekarang jika Anda meninggalkan attitudeistilah efek tetap (yaitu set , atau lepaskan istilah dari rumus) Anda dapat melihat (tanpa menulis ulang semuanya) itu, karena efek acak diasumsikan memiliki nol rata-rata, kami akan menjadi dengan asumsi bahwa respons rata-rata terhadap sikap lintas subjek dan skenario akan sama dengan nol, sementara masih ada variasi di antara subjek dan skenario. Saya tidak akan mengatakan ini tidak masuk akal dari sudut pandang statistik, tetapi jarang. Ada diskusi tentang masalah ini di milis [email protected] dari waktu ke waktu ... (atau dapat didiskusikan di StackExchange di suatu tempat - jika tidak, itu akan menjadi tindak lanjut yang baik -Tanyakan pertanyaan ...)β1=0attitude

Ben Bolker
sumber