Saya sedang membaca makalah teori Doug Bates pada paket lme4 R untuk lebih memahami seluk beluk model campuran, dan menemukan hasil yang menarik yang ingin saya pahami lebih baik, tentang menggunakan kemungkinan maksimum terbatas (REML) untuk memperkirakan varian. .
Dalam bagian 3.3 pada kriteria REML, ia menyatakan bahwa penggunaan REML dalam estimasi varians terkait erat dengan penggunaan koreksi derajat kebebasan ketika memperkirakan varians dari penyimpangan residual dalam model linier yang sesuai. Secara khusus, "meskipun biasanya tidak diturunkan dengan cara ini", derajat koreksi kebebasan dapat diturunkan dengan memperkirakan varians melalui optimalisasi "kriteria REML" (Persamaan (28)). Kriteria REML pada dasarnya hanyalah kemungkinan, tetapi parameter kecocokan linier telah dihilangkan dengan memarginalkan (alih-alih menetapkannya sama dengan estimasi kecocokan, yang akan memberikan varians sampel yang bias).
Saya melakukan matematika dan memverifikasi hasil yang diklaim untuk model linier sederhana dengan hanya efek tetap. Yang saya perjuangkan adalah interpretasinya. Apakah ada beberapa perspektif dari mana wajar untuk mendapatkan estimasi varians dengan mengoptimalkan kemungkinan di mana parameter fit telah dipinggirkan? Rasanya seperti Bayesian, seolah-olah saya memikirkan kemungkinan sebagai posterior dan meminggirkan parameter kecocokan seolah-olah mereka adalah variabel acak.
Atau apakah pembenarannya terutama hanya matematis - ia bekerja dalam kasus linear tetapi juga dapat digeneralisasikan?