"Minor utama urutan 1 tidak pasti positif" kesalahan menggunakan 2l.norm pada tikus

11

Saya mengalami masalah menggunakan 2l.normmetode imputasi bertingkat di mice.

Sayangnya saya tidak dapat memposting contoh yang dapat direproduksi karena ukuran data saya - ketika saya mengurangi ukurannya, masalahnya hilang.

Untuk variabel tertentu, micebuat kesalahan dan peringatan berikut:

Error in chol.default(inv.sigma2[class] * X.SS[[class]] + inv.psi) : 
  the leading minor of order 1 is not positive definite
In addition: Warning messages:
1: In rgamma(n.class, n.g/2 + 1/(2 * theta), scale = 2 * theta/(ss *  :
  NAs produced
2: In rgamma(1, n.class/(2 * theta) + 1, scale = 2 * theta * H/n.class) :
  NAs produced
3: In rgamma(1, n.class/2 - 1, scale = 2/(n.class * (sigma2.0/H - log(sigma2.0) +  :
  NAs produced

Jika saya menggunakan 2l.pan, normatau pmmmetode, masalah tidak terjadi.

Variabel memiliki distribusi berikut: masukkan deskripsi gambar di sini

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
   50.0   117.0   136.0   136.7   155.0   249.0    3124 

Juga, ukuran kelas memiliki distribusi berikut:

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   3.00   50.00   80.00   88.52  111.00  350.00 
Robert Long
sumber

Jawaban:

10

Saya memiliki masalah serupa di MICE, lihat diskusi mandiri saya di sini . Masalahnya terjadi karena Anda telah melengkapi model Anda (terlalu banyak parameter, variabel), beberapa variabel sangat kolinear atau Anda memiliki kasus yang memiliki kesalahan pada semua variabel.

Dalam kasus saya, modelnya terlalu pas. Salah satu cara untuk mengatasi masalah ini adalah dengan menyesuaikan matriks prediktor MICE. Anda dapat memberikan di imp$predmana objek impAnda mids, untuk melihat matriks prediktor. Kamu bisa menggunakan

new.pred <- quickpred(data)

mice(..., pred=new.pred)

untuk secara otomatis menghasilkan matriks prediktor berdasarkan korelasi bivariat dari variabel dalam data (misalnya Pearson, Spearman), di mana .10 adalah batas default. Ini dapat menyelesaikan masalah Anda. Lebih umum membangun model Anda dengan bijak dan tidak hanya menyertakan semua variabel yang mungkin Anda miliki.

Tomka
sumber