Saya perlu menyesuaikan distribusi Gaussian umum ke cloud 7-redup poin yang mengandung cukup banyak outlier dengan leverage tinggi. Apakah Anda tahu paket R yang bagus untuk pekerjaan ini?
r
distributions
normal-distribution
robust
kjetil b halvorsen
sumber
sumber
Jawaban:
Ada juga mclust: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html
Namun satu peringatan: pemodelan campuran dalam ruang dimensi tinggi dapat membuat CPU dan memori cukup intensif jika awan poin Anda besar. Sekitar empat tahun yang lalu saya melakukan batch 11-dimensi, data titik 50-200K, dan itu cenderung berjalan ke 4-11GB RAM dan membutuhkan waktu hingga satu minggu untuk menghitung untuk setiap kasus (dan saya punya 400). Ini tentu saja mungkin, tetapi dapat menjadi sakit kepala jika Anda menggunakan cluster komputasi bersama atau memiliki sumber daya yang terbatas.
sumber
Ini terdengar seperti Model Campuran Gaussian multivariat klasik. Saya pikir paket BayesM mungkin berfungsi.
Berikut adalah beberapa paket Campuran Gaussian multivarian
sumber