Tarif tidak ada dan imputasi berganda

8

Apakah ada batas yang paling tidak dapat diterima saat menggunakan multiple imputation (MI)?

Sebagai contoh, bisakah saya menggunakan MI jika nilai yang hilang dalam suatu variabel adalah 20% dari kasus sementara dan variabel lain memiliki nilai yang hilang tetapi tidak sampai tingkat yang tinggi?

Nick
sumber
Saya tidak akan menganggap 20% sangat tinggi, jadi saya yakin jawaban untuk pertanyaan kedua Anda adalah ya, meskipun saya tidak memiliki justifikasi yang ketat. Perasaan saya adalah bahwa satu-satunya batasan adalah yang mencegah algoritma bekerja sama sekali. Samar-samar saya ingat melihat sebuah meja di buku Rubin yang menunjukkan hasil untuk tingkat kehilangan yang sangat tinggi. Apakah itu bermanfaat (berlawanan dengan valid) melakukan MI dengan tingkat kehilangan yang sangat tinggi adalah pertanyaan lain.
mark999
1
Banyak yang akan tergantung pada seberapa banyak Anda dapat menganggap bahwa kehilangan Anda hilang sepenuhnya secara acak. Jika ada persentase kesalahan yang tinggi dan tidak hilang secara acak, Anda mungkin mendapatkan estimasi yang bias untuk imputasi. Karena itu harus dilakukan pada kasus-kasus yang ada dalam data (menurut definisi), di mana ada bias sistematis dalam kasus-kasus yang hilang, kasus-kasus ini mungkin tidak terlalu informatif dari perspektif akurasi.
Michelle
@ mark999 - Terima kasih atas jawabannya. Kapan tingkat hilangnya satu variabel dapat dianggap tinggi? Mengenai pertanyaan terakhir Anda, apakah Anda punya jawaban?
Nick
@Michelle - Terima kasih. Untungnya hipotesis MAR cukup masuk akal (dan bahkan MCAR dapat dianggap masuk akal)
Nick
@Nick: Saya tidak tahu apa yang harus dianggap sebagai tingkat yang sangat tinggi, dan saya pikir itu tidak perlu untuk memasukkan nomor tertentu di atasnya. Saya tidak punya jawaban untuk pertanyaan terakhir.
mark999

Jawaban:

3

Dari komentar, Anda yakin bahwa Anda dalam situasi MAR atau MCAR. Maka beberapa imputasi setidaknya masuk akal. Jadi, seberapa banyak hilangnya yang bisa ditelusuri? Pikirkan seperti ini:

Pada dasarnya, beberapa imputasi membuat semua perkiraan parameter model Anda menjadi kurang pasti sebagai fungsi dari akurasi data yang hilang dapat diprediksi dengan model imputasi Anda, yang akan tergantung, antara lain, pada jumlah yang hilang yang perlu dimasukkan, dan jumlah imputasi yang Anda gunakan.

Hilangnya 'terlalu banyak' karena itu tergantung pada seberapa banyak variasi tambahan / ketidakpastian yang ingin Anda hadapi. Kuantitas yang berguna untuk Anda mungkin adalah efisiensi relatif ( ) dari analisis MI. Ini tergantung pada 'fraksi informasi yang hilang' (bukan tingkat hilangnya yang sederhana), biasanya disebut , dan jumlah imputasi, biasanya disebut , seperti .REλmRE1/(1+λ/m)

Alih-alih menghasilkan definisi informasi yang hilang dll. Di sini, Anda mungkin hanya membaca FAQ MI yang menempatkan semuanya dengan sangat jelas. Dari sana Anda akan tahu apakah Anda ingin menangani sumber asli: Rubin dll.

Secara praktis Anda mungkin harus mencoba analisis imputasi dan melihat bagaimana hasilnya.

conjugateprior
sumber
tautan FAQ rusak. Apakah ada kemungkinan Anda memiliki yang saat ini? (kelihatannya berguna)
drstevok
Ditambahkan. Tidak yakin seberapa resmi itu.
conjugateprior
1

Anda mungkin menemukan

Rubin, Donald B. dan Nathaniel Schenker. 1986. "Imputasi Berganda untuk Estimasi Interval dari Sampel Acak Sederhana dengan Ignorable Nonresponse." Jurnal Asosiasi Statistik Amerika 81 (394): 366–374.

bermanfaat.

RTM
sumber
1
Bisakah Anda meringkas dalam beberapa kata rekomendasi Rubin sehingga jawaban ini tetap mandiri?
chl
Saya harus mendapatkannya. Saya juga pernah mendengar Joe Shaffer dari Penn State mengatakan (baru-baru ini) bahwa MI itu baik kecuali datanya "BENAR-BENAR tidak dapat dilupakan"
Peter Flom
@Peter Flom: Pernyataan Shaffer menarik - apakah Anda tahu detailnya?
mark999
1
@ Peter Flom: Terima kasih (saya keliru menafsirkan "jauh lebih baru" sebagai "baru-baru ini").
mark999
1
@Peter Flom. Saya salah ketik. Sisa komentar saya masuk akal jika Anda menempatkan 'non' yang hilang di depan!
conjugateprior