Saya telah menggunakan beberapa imputasi untuk mendapatkan sejumlah set data yang lengkap.
Saya telah menggunakan metode Bayesian pada masing-masing set data yang lengkap untuk mendapatkan distribusi posterior untuk parameter (efek acak).
Bagaimana saya bisa menggabungkan / menggabungkan hasil untuk parameter ini?
Lebih banyak konteks:
Model saya bersifat hierarkis dalam arti masing-masing siswa (satu pengamatan per murid) yang dikelompokkan di sekolah. Saya telah melakukan beberapa imputasi (menggunakan MICE
R) pada data saya di mana saya termasuk school
sebagai salah satu prediktor untuk data yang hilang - untuk mencoba memasukkan hierarki data ke dalam imputasi.
Saya telah memasang model kemiringan acak sederhana untuk masing-masing set data lengkap (menggunakan MCMCglmm
dalam R). Hasilnya adalah biner.
Saya telah menemukan bahwa kerapatan posterior dari varian lereng acak adalah "berperilaku baik" dalam arti bahwa mereka terlihat seperti ini:
Bagaimana saya bisa menggabungkan / menyatukan sarana posterior dan interval yang kredibel dari setiap dataset yang diperhitungkan, untuk efek acak ini?
Pembaruan1 :
Dari apa yang saya pahami sejauh ini, saya bisa menerapkan aturan Rubin pada rata-rata posterior, untuk memberikan rata-rata posterior berganda - apakah ada masalah dengan melakukan ini? Tapi saya tidak tahu bagaimana saya bisa menggabungkan interval yang kredibel 95%. Juga, karena saya memiliki sampel kerapatan posterior aktual untuk setiap imputasi - dapatkah saya menggabungkannya?
Pembaruan2 :
Seperti saran per @ cyan dalam komentar, saya sangat menyukai gagasan untuk hanya menggabungkan sampel dari distribusi posterior yang diperoleh dari setiap dataset lengkap dari beberapa imputasi. Namun, saya ingin tahu alasan teoretis untuk melakukan ini.
sumber
Jawaban:
Dengan posisi luar yang berperilaku baik yang dapat dijelaskan secara memadai oleh deskripsi parametrik dari suatu distribusi, Anda mungkin dapat dengan mudah mengambil mean dan varian yang paling menggambarkan posterior Anda dan pergi dari sana. Saya menduga ini mungkin memadai dalam banyak keadaan di mana Anda tidak mendapatkan distribusi posterior yang benar-benar aneh.
sumber
Jika Anda menggunakan stata ada prosedur yang disebut "mim" yang mengumpulkan data setelah imputasi digunakan untuk model efek campuran. Saya tidak tahu apakah itu tersedia dalam R.
sumber