Saya berharap untuk menyatukan hasil dari serangkaian analisis mendasar yang dilakukan pada data yang dilipatgandakan (misalnya regresi berganda, ANOVA). Beberapa imputasi dan analisis telah diselesaikan dalam SPSS tetapi SPSS tidak memberikan hasil gabungan untuk beberapa statistik termasuk nilai-F, matriks kovarian, R-Squared dll.
Saya telah melakukan beberapa upaya untuk mengatasi masalah ini dengan merambah ke R atau mencoba makro yang tersedia dan belum berhasil menyelesaikan masalah (misalnya dengan mengalami masalah dengan menggabungkan statistik untuk lebih dari 5 imputasi pada Tikus, misalnya).
Pada titik ini, saya ingin mencoba menghitung ini dengan tangan, menerapkan aturan Rubin, menggunakan output yang dihasilkan SPSS. Namun, saya tidak yakin bagaimana saya bisa mendapatkan varians dalam-imputasi ( ) berdasarkan output yang dihasilkan SPSS.
Saya akan sangat menghargai instruksi rinci tentang ini.
sumber
Jawaban:
Aturan Rubin hanya dapat diterapkan pada parameter setelah distribusi normal. Untuk parameter dengan distribusi F atau Chi Square diperlukan serangkaian formula yang berbeda:
Untuk melakukan ANOVA pada beberapa dataset yang bermasalah, Anda dapat menggunakan paket miceadds ( pdf ;
miceadds::mi.anova
).Perbarui 1
Ini adalah contoh lengkapnya:
Ekspor data Anda dari SPSS ke R. Dalam Spss simpan dataset Anda sebagai .csv
Baca dalam dataset Anda:
Mari kita asumsikan, itur e a di n g adalah variabel dependen Anda dan Anda memiliki dua faktor
Sekarang mari kita ubah mereka menjadi faktor:
Konversikan dataset Anda ke objek mid, kami menganggap, bahwa variabel pertama menyimpan nomor imputasi (Imputation_ dalam SPSS):
Sekarang Anda dapat melakukan ANOVA:
Perbarui 2 Ini adalah balasan untuk komentar kedua Anda:
Apa yang Anda jelaskan di sini adalah masalah terkait data impor / ekspor antara SPSS dan R. Anda bisa mencoba untuk mengimpor
.sav
file yang langsung ke R dan ada sekelompok paket khusus untuk itu:foreign
,rio
,gdata
,Hmisc
, dll saya lebih suka yang csv-cara , tapi itu masalah selera dan / atau tergantung pada sifat masalah Anda. Mungkin Anda juga harus memeriksa beberapa tutorial di youtube atau sumber lain di internet.Perbarui 3 Ini adalah balasan untuk komentar pertama Anda:
Ya, Anda dapat melakukan analisis dalam SPSS dan menggabungkan nilai-nilai F di
miceadds
(harap perhatikan contoh ini diambil darimiceadds::micombine.F
halaman bantuan):sumber
$<-.data.frame
(*tmp*
, "IV1", nilai = integer (0)): penggantian memiliki 0 baris, data memiliki 10> dat.mids = as.mids (dat) Kesalahan pada tikus (data [data [, .imp] = = 0, -c (.imp, .id)], m = max (as.numeric (data [,: Data harus mengandung setidaknya dua kolom> fit = mi.anova (mi.res = dat.mids, formula = "DV ~ IV1 * IV2 * INT", ketik = 3) ringkasan (cocok) Kesalahan: simbol tak terduga di "fit = mi.anova (mi.res = dat.mids, rumus =" DV ~ IV1 * IV2 * INT ", type = 3) ringkasan ">Anda dengan benar menuliskan estimator gabungan:
DimanaUsaya mewakili hasil analitik dari saya -Data yang ditetapkan. Biasanya, hasil analitik memiliki beberapa distribusi mendekati normal dari mana kita menarik kesimpulan atau membuat batas kepercayaan. Ini terutama dilakukan dengan menggunakan nilai rata-rata (Usaya ) dan kesalahan standarnya. T-tes, regresi linier, regresi logistik, dan pada dasarnya sebagian besar analisis dapat diringkas secara memadai dalam hal nilai tersebutUsaya dan kesalahan standarnya se (Usaya) .
Aturan Rubin menggunakan hukum varians total untuk menuliskan varians sebagai jumlah dari varians antara dan di dalam imputasi:
Istilah pertama adalah dalam varian sehinggaE[ var (U¯|Usaya) =1m∑mi = 1Vsaya dimana Vsaya adalah varian dari hasil analisis dari saya - dataset lengkap atau imputasi. Istilah terakhir adalah varian antara-imputasi:var ( E[U¯|Usaya] ) =M.+ 1M.- 1∑mi = 1(Usaya-U¯)2 . Saya tidak pernah benar-benar memahami koreksi DF di sini, tetapi ini pada dasarnya adalah pendekatan yang diterima.
Bagaimanapun, karena jumlah imputasi yang disarankan adalah kecil (Rubin menyarankan sedikitnya 5), biasanya dimungkinkan untuk menghitung angka ini dengan memasangkan setiap analisis dengan tangan. Contoh dengan tangan terdaftar di bawah ini:
Memberikan hasil sebagai berikut:
Jadi varians dalam adalah rata-rata varians estimasi titik imputasi spesifik: 3,8 (rata-rata kolom kedua). Varians antara varians adalah 0,35 varians dari kolom pertama). Menggunakan koreksi DF kita mendapatkan varian 4.23. Ini setuju dengan
pool
perintah yang diberikan dalammice
paket.yang menunjukkan SE = 2.057 untuk koefisien model, (Variance = SE ** 2 = 4.23).
Saya gagal melihat bagaimana meningkatkan jumlah dataset yang bermasalah menciptakan masalah tertentu. Jika Anda tidak dapat memberikan contoh kesalahan, saya tidak tahu bagaimana menjadi lebih bermanfaat. Tetapi kombinasi dengan tangan dipastikan untuk mengakomodasi berbagai strategi pemodelan.
Makalah ini membahas cara-cara lain bahwa hukum varians total dapat menurunkan estimasi varians dari estimasi gabungan. Secara khusus, penulis menunjukkan (dengan benar) bahwa asumsi yang diperlukan untuk Peraturan Rubin bukanlah normal dari perkiraan titik tetapi sesuatu yang disebut pengertian. Normalitas WRT, sebagian besar estimasi titik yang berasal dari model regresi memiliki konvergensi cepat di bawah teorema batas pusat, dan bootstrap dapat menunjukkan hal ini kepada Anda.
sumber
pool(fit)
.