Apakah ada batas yang paling tidak dapat diterima saat menggunakan multiple imputation (MI)?
Sebagai contoh, bisakah saya menggunakan MI jika nilai yang hilang dalam suatu variabel adalah 20% dari kasus sementara dan variabel lain memiliki nilai yang hilang tetapi tidak sampai tingkat yang tinggi?
Jawaban:
Dari komentar, Anda yakin bahwa Anda dalam situasi MAR atau MCAR. Maka beberapa imputasi setidaknya masuk akal. Jadi, seberapa banyak hilangnya yang bisa ditelusuri? Pikirkan seperti ini:
Pada dasarnya, beberapa imputasi membuat semua perkiraan parameter model Anda menjadi kurang pasti sebagai fungsi dari akurasi data yang hilang dapat diprediksi dengan model imputasi Anda, yang akan tergantung, antara lain, pada jumlah yang hilang yang perlu dimasukkan, dan jumlah imputasi yang Anda gunakan.
Hilangnya 'terlalu banyak' karena itu tergantung pada seberapa banyak variasi tambahan / ketidakpastian yang ingin Anda hadapi. Kuantitas yang berguna untuk Anda mungkin adalah efisiensi relatif ( ) dari analisis MI. Ini tergantung pada 'fraksi informasi yang hilang' (bukan tingkat hilangnya yang sederhana), biasanya disebut , dan jumlah imputasi, biasanya disebut , seperti .RE λ m RE≈1/(1+λ/m)
Alih-alih menghasilkan definisi informasi yang hilang dll. Di sini, Anda mungkin hanya membaca FAQ MI yang menempatkan semuanya dengan sangat jelas. Dari sana Anda akan tahu apakah Anda ingin menangani sumber asli: Rubin dll.
Secara praktis Anda mungkin harus mencoba analisis imputasi dan melihat bagaimana hasilnya.
sumber
Anda mungkin menemukan
bermanfaat.
sumber