Diagnostik Residual dan Homogenitas varian dalam model linier campuran

10

Sebelum mengajukan pertanyaan ini, saya mencari di situs kami dan menemukan banyak pertanyaan serupa, (seperti di sini , di sini , dan di sini ). Tetapi saya merasa pertanyaan-pertanyaan terkait itu tidak ditanggapi atau didiskusikan dengan baik, sehingga ingin mengajukan pertanyaan ini lagi. Saya merasa harus ada banyak pendengar yang ingin pertanyaan semacam ini dijelaskan lebih jelas.

Untuk pertanyaan saya, pertama-tama pertimbangkan model efek campuran linier, mana X β adalah komponen efek tetap linier, Z adalah matriks desain tambahan yang sesuai dengan parameter efek-acak , γ . Dan ϵ N ( 0 , σ 2 I ) adalah istilah kesalahan yang biasa.

y=Xβ+Zγ+ϵ
XβZγϵ  N(0,σ2I)

Mari kita asumsikan satu-satunya faktor efek tetap menjadi variabel perawatan , dengan 3 level berbeda. Dan satu-satunya faktor efek acak adalah Subjek variabel . Yang mengatakan, kami memiliki model efek campuran dengan efek pengobatan tetap dan efek subjek acak.

Pertanyaan saya adalah:

  1. Adakah homogenitas asumsi varian dalam pengaturan model campuran linier, analog dengan model regresi linier tradisional? Jika demikian, apa arti asumsi khusus dalam konteks masalah model campuran linier yang disebutkan di atas? Apa asumsi penting lain yang perlu dinilai?

Pikiranku: YA. asumsi (maksud saya, nol kesalahan rata-rata, dan varians yang sama) masih dari sini: . Dalam pengaturan model regresi linier tradisional, kita dapat mengatakan bahwa anggapannya adalah bahwa "varians kesalahan (atau hanya varians dari variabel dependen) adalah konstan di semua 3 tingkat perlakuan". Tapi saya bingung bagaimana kita bisa menjelaskan asumsi ini di bawah pengaturan model campuran. Haruskah kita mengatakan "variasinya konstan di 3 tingkat perawatan, mengkondisikan subjek? Atau tidak?"ϵ  N(0,σ2I)

  1. SAS dokumen online tentang residual dan pengaruh diagnostik membawa dua residu yang berbeda, yaitu, residu Marginal , dan residu Bersyarat , r c = Y - X β - Z γ = r m - Z γ .

    rm=YXβ^
    rc=YXβ^Zγ^=rmZγ^.
    Pertanyaan saya adalah, untuk apa dua residu itu digunakan? Bagaimana kita bisa menggunakannya untuk memeriksa asumsi homogenitas? Bagi saya, hanya residu marjinal yang dapat digunakan untuk mengatasi masalah homogenitas, karena itu sesuai dengan model. Apakah pemahaman saya di sini benar?ϵ
  2. Apakah ada tes yang diajukan untuk menguji asumsi homogenitas dalam model linier campuran? @ Kam menunjukkan tes levene sebelumnya, apakah ini cara yang benar? Jika tidak, apa arahnya? Saya pikir setelah kita cocok dengan model campuran, kita bisa mendapatkan residu, dan mungkin bisa melakukan beberapa tes (seperti tes good-of-fit?), Tetapi tidak yakin bagaimana itu akan terjadi.

  3. Saya juga memperhatikan bahwa ada tiga jenis residu dari Proc Mixed di SAS, yaitu residu Raw , residu Studentized , dan residu Pearson . Saya bisa memahami perbedaan di antara mereka dalam hal formula. Tetapi bagi saya mereka tampaknya sangat mirip ketika datang ke plot data nyata. Jadi bagaimana seharusnya mereka digunakan dalam praktik? Apakah ada situasi di mana satu jenis lebih disukai daripada yang lain?

  4. Untuk contoh data nyata, dua plot residual berikut berasal dari Proc Mixed in SAS. Bagaimana asumsi Homogenitas varian dapat diatasi oleh mereka?

[Aku tahu aku punya beberapa pertanyaan di sini. Jika Anda bisa memberikan saya pemikiran Anda untuk pertanyaan apa pun, itu bagus. Tidak perlu membahas semuanya jika Anda tidak bisa. Saya benar-benar ingin membahas tentang mereka untuk mendapatkan pemahaman penuh. Terima kasih!]

Berikut adalah plot residu marjinal (mentah). Berikut adalah plot residu marjinal (mentah).

Berikut adalah plot residual (mentah) bersyarat. Berikut adalah plot residual (mentah) bersyarat.

Aaron Zeng
sumber
Pertanyaan hebat - jawaban yang mungkin untuk nomor 2 Anda dapat ditemukan di sini comp.soft-sys.sas.narkive.com/7Qmrgufe/…
dandar

Jawaban:

3

ϵ  N(0,σ2I)ϵ

ϵ

Aaron Zeng
sumber
γ
1

Ini adalah topik yang sangat luas dan saya hanya akan memberikan gambaran umum tentang koneksi ke regresi linier standar.

yiN(Xiβ,ZiDZi+σ2I),
γiN(0,D)iΣi=ZiDZi+σ2IΣi=LiLi
yi=Li1yi;Xi=Li1Xi.

βyiXiyiXi

Yang perlu kita lakukan adalah:

  1. Σi
  2. pasang kembali regresi OLS menggunakan data yang diubah.

Regresi OLS mengasumsikan pengamatan independen dengan varians yang homogen, sehingga teknik diagnostik standar dapat diterapkan pada residunya.

Li

ϵ

Randel
sumber
Kertas berita pers panas tentang topik ini.
Randel