Saya sering menemukan diri saya melatih beberapa model prediktif berbeda menggunakan caret
R. Saya akan melatih mereka semua pada lipatan validasi silang yang sama, menggunakan caret::: createFolds
, kemudian memilih model terbaik berdasarkan kesalahan lintas-divalidasi.
Namun, prediksi median dari beberapa model sering mengungguli model tunggal terbaik pada set tes independen. Saya sedang berpikir untuk menulis beberapa fungsi untuk model susun / ensembling caret yang dilatih dengan lipatan validasi silang yang sama, misalnya dengan mengambil prediksi median dari masing-masing model pada setiap lipatan, atau dengan melatih "model-meta."
Tentu saja, ini mungkin memerlukan loop validasi silang luar. Apakah ada yang tahu tentang paket yang ada / kode sumber terbuka untuk model caret ensembling (dan mungkin memvalidasi lintas ansambel tersebut)?
Apa yang Anda cari disebut "model ensembling". Tutorial pengantar sederhana dengan kode R dapat ditemukan di sini: http://viksalgorithms.blogspot.jp/2012/01/intro-to-ensemble-learning-in-r.html
sumber
Saya tidak yakin apa yang Anda cari tetapi ini mungkin membantu: http://www.jstatsoft.org/v28/i05/paper
Ini adalah cara menggunakan banyak model dalam caret. Bagian yang Anda mungkin tertarik adalah bagian 5 pada hal. 13.
sumber