Saya bertanya-tanya bagaimana cara mengintegrasikan splines kubik terbatas (seperti dalam paket rms) dalam model imputasi dalam paket imputasi tikus.
Konteks : Saya sedang melakukan penelitian biomedis dan memiliki akses ke dataset yang terdiri dari karakteristik pasien dan data tentang perkembangan penyakit pasien, di samping hasil setelah perawatan medis (misalnya kelangsungan hidup satu tahun). Tujuannya adalah untuk membangun model prediksi berdasarkan karakteristik pasien dan perkembangan penyakit untuk memprediksi terjadinya hasil tertentu. Sayangnya, beberapa pasien tidak memiliki informasi lengkap tentang semua variabel. Karena itu saya telah memutuskan untuk menggunakan beberapa teknik imputasi untuk memperkirakan (beberapa kali) apa nilai-nilai yang hilang tersebut.
Masalah : Saat menggunakan beberapa imputasi ada 'aturan' ini yang disebut pengertian. Ini berarti imputasi memerlukan model statistik yang digunakan untuk analisis akhir (yaitu model prediksi yang ingin saya pelajari) juga harus dimasukkan dalam model imputasi (lebih disukai dengan informasi tambahan ditambahkan ke dalamnya). Ini juga berarti mempertimbangkan kemungkinan asosiasi non-linear. Karena saya tidak tahu apakah prediktor tertentu memiliki asosiasi non-linear dengan yang lain, saya ingin model imputasi dapat disesuaikan dengan splines kubik terbatas. Namun, saya tidak begitu mengerti bagaimana melakukan ini pada tikus. Karena itu saya ingin membantu dalam membuat model imputasi yang memungkinkan untuk rcs, cocok untuk tikus.
Pada sidenote ke moderator: Saya pikir pertanyaan ini cocok untuk Crossvalidated karena imputasi dan splines adalah subjek 'statistik' yang spesifik. Namun, karena fokus pada sifat pemrograman dari pertanyaan 'bagaimana untuk' ini, saya tidak akan keberatan jika pertanyaan tersebut dimigrasi jika Anda pikir itu lebih cocok di tempat lain. Setelah keraguan ini, saya juga memposting pertanyaan ini di StackOverflow ( /programming/45674088/how-to-use-restricted-cubic-splines-with-r-mice-imputation-package )
Jawaban:
Anda benar bahwa model imputasi harus sekaya atau lebih kaya daripada model hasil. Fakta bahwa imputasi berdasarkan estimasi kemungkinan maksimum penuh dan imputasi yang dilakukan dengan
mice
mengasumsikan linearitas di mana-mana adalah alasan utama saya menulis fungsiHmisc
paket RaregImpute
, yang membuat model imputasi secara otomatis menggunakan model spline kubik kaya aditif terbatas kaya. Jadi linearitas tidak diasumsikan untuk imputasi berganda. Pendekatan default dalamaregImpute
adalah pencocokan rata-rata prediktif, yang umumnya saya lebih suka daripada pendekatan yang lebih parametrik (splines masih digunakan; PMM kurang parametrik di sisi kiri model).Seperti
mice
,aregImpute
menggunakan persamaan dirantai. Tidak sepertimice
itu, ia menggunakan imbang bootstrap alih-alih perkiraan (dengan asumsi multivarian normality) Bayesian posterior draws.sumber
mice
ketika nol knot (linearitas) digunakan) yang akan menjadi bagian yang baik dari paket R. Saat melakukan ini, Anda dapat membandingkanmice
danaregImpute
kode untuk melihat di manamice
agak lambat dan dapat dipercepat.