Ada beberapa utas tentang R-sig-ME tentang mendapatkan interval kepercayaan untuk prediksi menggunakan lme4
dan nlme
dalam R. Misalnya di sini dan di sini pada tahun 2010, termasuk beberapa komentar oleh Dougals Bates, salah satu penulis kedua paket. Saya ragu untuk mengutipnya kata demi kata, karena takut mereka dikeluarkan dari konteks, tetapi bagaimanapun, satu komentar yang dia buat adalah
"Anda menggabungkan parameter dan variabel acak dalam prediksi Anda dan saya tidak yakin apa artinya untuk menilai variabilitas prediksi tersebut. Seorang Bayesian mungkin dapat memahaminya, tetapi saya tidak bisa memahaminya. " https://stat.ethz.ch/pipermail/r-sig-mixed-models/2010q1/003447.html
Saya tahu bahwa paket Bayesian glmm MCMCglmm
dapat menghasilkan interval yang kredibel untuk prediksi.
Akhir-akhir ini, versi pengembangan lme4
pada github telah diberikan predict
metode, tetapi disertai dengan komentar berikut:
"@note Tidak ada pilihan untuk menghitung kesalahan prediksi standar karena sulit untuk mendefinisikan metode yang efisien yang menggabungkan ketidakpastian dalam parameter varians; kami merekomendasikan \ code {\ link {bootMer}} untuk tugas ini." https://github.com/lme4/lme4/blob/master/R/predict.R
Jadi, mengapa sulit untuk memasukkan ketidakpastian dalam efek acak ketika membuat prediksi dari model campuran dalam pengaturan yang sering terjadi?
sumber
Untuk waktu yang lama saya bertanya-tanya tentang kepercayaan yang tampaknya umum bahwa ada beberapa perbedaan mendasar dalam efek tetap dan acak untuk model efek campuran (umumnya nonlinier). Kepercayaan ini misalnya dinyatakan oleh Bates dalam tanggapan berikut
https://stat.ethz.ch/pipermail/r-sig-mixed-models/2010q1/003447.html
Bates dengan jelas menyatakan bahwa ia percaya ada perbedaan mendasar antara efek tetap dan acak sehingga tidak dapat digabungkan. Saya pikir dia salah dan saya berharap dapat meyakinkan beberapa pembaca tentang sudut pandang alternatif. Saya mengambil pendekatan yang sering jadi apa yang ingin saya lakukan adalah mendefinisikan gagasan tentang kemungkinan profil untuk fungsi efek tetap dan acak. Untuk memotivasi diskusi misalkan kita memiliki model dua parameter dengan parameter x dan u (sejauh ini tidak ada efek acak). Biarkan menjadi fungsi kemungkinan di mana kita menekan referensi apa pun ke data. Biarkan menjadi fungsi (dan bagus) dari x dan u. Kemungkinan profil untuk fungsi diberikan olehg ( x , u ) P g ( t ) gL(x,u) g(x,u) Pg(t) g
Saya percaya bahwa tidak ada yang akan berdebat dengan ini. Sekarang anggaplah kita memiliki distribusi probabilitas untuk u. Maka saya akan mengklaim bahwa kemungkinan profil untuk masih masuk akal, tetapi kita harus memodifikasi (1) dengan memasukkan yang sebelumnya.gp(u) g
u F ( x ) F ( x ) = ∫ L ( x , u ) p ( u ) d u u F (
Jadi untuk mendapatkan informasi tentang fungsi kita tidak boleh berintegrasi dengan parameter . Tetapi apa yang terjadi dalam kasus di mana ada banyak parameter efek acak. Lalu saya mengklaim bahwa kita harus berintegrasi di atas `` sebagian besar '' tetapi tidak semua dari mereka dalam arti saya akan membuat tepat. Untuk memotivasi konstruksi, biarkan ada efek acak . Pertimbangkan kasus khusus di mana fungsi hanya bergantung pada , dan sebenarnya adalah fungsi yang paling sederhana yang bisa dibayangkan, . Integrasikan atas efek acak untuk mendapatkang(x,u) u n u=(u1,u2,...,un−1,un) g(x,u) un g(x,u)=un u1,u2,...,un−1
Untuk fungsi umum kita membentuk fungsi didefinisikan oleh dan menghitung kemungkinan profilg(x,u) F(x,s) (5)
Kemungkinan profil ini adalah konsep yang didefinisikan dengan baik dan berdiri sendiri. Namun untuk menjadi berguna dalam praktiknya seseorang harus dapat menghitung nilainya, setidaknya sekitar. Saya percaya bahwa untuk banyak model fungsi dapat didekati dengan cukup baik menggunakan varian dari pendekatan Laplace. Tentukan oleh Misalkan H adalah hessian dari log fungsi sehubungan dengan parameter dan .F(x,s) x^(s),u^(s)
Set level adalah submanifold dimensi dari ruang dimensi mana terdapat efek tetap dan efek acak. Kita perlu mengintegrasikan form ke manifold ini di mana semua dilinearisasi pada Ini melibatkan sedikit geometri diferensial dasar. Asumsikan Dengan reparameterisasi kita dapat mengasumsikan bahwa dan . Kemudian pertimbangkan petanyag m+n−1 n+m m n n du1∧du2∧…∧dun x^(s),u^(s) gxn(x^(s),u^(s))≠0 x^(s)=0 u^(s)=0
Kemunduran Hessian adalah bentuk kuadratik
Jadi integral dapat dihitung (atau diperkirakan) melalui pendekatan Laplace yang merupakan rumus umum yang melibatkan logaritma penentu , yang dihitung melalui dekomposisi Cholesky. Nilai perkiraan Laplace dari integral adalah manaadalah penentu. kita masih harus berurusan dengan lebar dari set level sebagai Untuk pesanan pertama ini memiliki nilai di mana adalah vektor turunan parsial dariT | ⋅| gε→0ε/‖∇g(x(s),u(
sumber