Saya merujuk pada makalah ini : Hayes JR, Groner JI. "Menggunakan skor imputasi dan kecenderungan ganda untuk menguji efek kursi mobil dan penggunaan sabuk pengaman pada tingkat keparahan cedera dari data registrasi trauma." J Pediatr Surg. 2008 Mei; 43 (5): 924-7.
Dalam penelitian ini, beberapa imputasi dilakukan untuk mendapatkan 15 set data lengkap. Skor kecenderungan kemudian dihitung untuk setiap dataset. Kemudian, untuk setiap unit pengamatan, sebuah catatan dipilih secara acak dari salah satu dari 15 dataset yang telah dilengkapi (termasuk skor kecenderungan terkait) sehingga menciptakan satu data akhir tunggal yang kemudian dianalisis dengan pencocokan skor kecenderungan.
Pertanyaan saya adalah: Apakah ini cara yang valid untuk melakukan pencocokan skor kecenderungan berikut beberapa kali imputasi? Adakah cara alternatif untuk melakukannya?
Untuk konteks: Dalam proyek baru saya, saya bertujuan untuk membandingkan efek dari 2 metode pengobatan menggunakan pencocokan skor kecenderungan. Ada data yang hilang dan saya bermaksud menggunakan MICE
paket dalam R untuk menghitung nilai yang hilang, kemudian twang
untuk melakukan pencocokan skor kecenderungan, dan kemudian lme4
untuk menganalisis data yang cocok.
Pembaruan1:
Saya telah menemukan makalah ini yang mengambil pendekatan yang berbeda: Mitra, Robin dan Reiter, Jerome P. (2011) Skor kecenderungan yang cocok dengan kovariat yang hilang melalui imputasi berulang berurutan, berulang [Kertas Kerja]
Dalam makalah ini penulis menghitung skor kecenderungan pada semua dataset yang diperhitungkan dan kemudian mengumpulkannya dengan rata-rata, yang merupakan semangat beberapa imputasi menggunakan aturan Rubin untuk estimasi titik - tetapi apakah itu benar-benar berlaku untuk skor kecenderungan?
Akan sangat menyenangkan jika siapa pun di CV dapat memberikan jawaban dengan komentar tentang 2 pendekatan berbeda ini, dan / atau yang lainnya ....
sumber
cobalt
paket yang berjudul "Menggunakan kobalt dengan Data yang Rumit". Anda dapat mengaksesnya di sini: CRAN.R-project.org/package=cobaltMungkin ada benturan dua paradigma. Beberapa imputasi adalah solusi Bayesian yang sangat berbasis model: konsep imputasi yang tepat pada dasarnya menyatakan bahwa Anda perlu mengambil sampel dari distribusi posterior data yang terdefinisi dengan baik, jika tidak, Anda akan kacau. Pencocokan skor kecenderungan, di sisi lain, adalah prosedur semi-parametrik: setelah Anda menghitung skor kecenderungan Anda (tidak peduli bagaimana, Anda bisa menggunakan estimasi kepadatan kernel, belum tentu model logit), Anda dapat melakukan sisanya dengan hanya mengambil perbedaan antara pengamatan yang diobati dan yang tidak diobati dengan skor kecenderungan yang sama, yang sekarang agak non-parametrik, karena tidak ada model yang tersisa yang mengontrol kovariat lainnya. Saya tidakAbadie dan Imbens (2008) membahas bahwa tidak mungkin untuk benar-benar mendapatkan kesalahan standar dalam beberapa situasi yang cocok). Saya akan memberi lebih banyak kepercayaan pada pendekatan yang lebih halus seperti pembobotan oleh kecenderungan terbalik. Referensi favorit saya adalah "Mostly Harmless Econometrics" , subtitle "An Empiricist Companion", dan ditujukan untuk para ekonom, tetapi saya pikir buku ini harus menjadi bacaan wajib bagi ilmuwan sosial lainnya, kebanyakan ahli biostatistik, dan ahli statistik non-bio juga demikian bahwa mereka tahu bagaimana disiplin ilmu lain mendekati analisis data.
Bagaimanapun, hanya menggunakan satu dari 15 jalur data lengkap yang disimulasikan per pengamatan setara dengan imputasi tunggal. Akibatnya, Anda kehilangan efisiensi dibandingkan dengan 15 set data yang lengkap, dan Anda tidak dapat memperkirakan kesalahan standar dengan benar. Sepertinya prosedur yang kurang bagi saya, dari sudut manapun.
Tentu saja, kami dengan senang hati menyapu asumsi bahwa kedua model imputasi ganda dan model kecenderungan adalah benar dalam arti memiliki semua variabel yang tepat dalam semua bentuk fungsional yang tepat. Ada sedikit cara untuk memeriksa itu (walaupun saya akan senang mendengar sebaliknya tentang tindakan diagnostik untuk kedua metode ini).
sumber
Saya tidak bisa berbicara dengan aspek teoretis dari pertanyaan itu, tetapi saya akan memberikan pengalaman saya menggunakan model PS / IPTW dan beberapa imputasi.
sumber