Saya mengerti secara teoritis (semacam) bagaimana mereka akan bekerja, tetapi saya tidak yakin bagaimana cara menggunakan metode ensemble (seperti voting, campuran tertimbang, dll.).
- Apa sumber daya yang baik untuk menerapkan metode ensemble?
- Apakah ada sumber daya khusus mengenai implementasi di Python?
EDIT:
Untuk menjernihkan beberapa berdasarkan diskusi pada komentar, saya tidak mencari algoritma ensemble seperti randomForest, dll. Sebaliknya, saya bertanya-tanya bagaimana Anda bisa menggabungkan klasifikasi yang berbeda dari algoritma yang berbeda.
Misalnya, seseorang menggunakan regresi logistik, SVM, dan beberapa metode lain untuk memprediksi kelas pengamatan tertentu. Apa cara terbaik untuk mendapatkan estimasi kelas terbaik berdasarkan prediksi ini?
sumber
'Metode Ensemble dalam Penambangan Data: Meningkatkan Akurasi Melalui Menggabungkan Prediksi', Seni dan Penatua - Referensi yang sangat baik tentang teori dan implementasi ansambel praktis, tetapi kode yang menyertainya berdasarkan R.
'Machine Learning: An Algorithmic Perspective,' S. Marsland - Teks praktis berbasis Python yang sangat baik, tetapi tidak didedikasikan untuk konsep ensemble murni sebagai referensi pertama.
sumber
Tanggapan Joe Pete yang gagah itu sempurna, tetapi karena Anda menyebutkan tentang implementasi Python, saya ingin menyebutkan proyek pembuatan bir dari Universidade Federal de Pernambuco.
https://github.com/viisar/brew
Pada titik ini, mereka memiliki generasi ensemble, kombinasi, pemangkasan dan seleksi dinamis.
Keterbatasan: hanya klasifikasi; tidak ada susun dalam versi publik saat ini; tidak banyak dokumentasi.
sumber
Salford Systems memiliki paket perangkat lunak yang disebut Random Forests yang mengimplementasikannya untuk ansambel pohon klasifikasi dan regresi. Saya tidak punya paket R gratis untuk ditawarkan. Saya membayangkan mereka memiliki manual pengguna yang akan menjelaskan implementasi mereka. Dengan analogi Anda mungkin bisa mengetahui cara melakukannya untuk metode ansambel lainnya.
sumber
Saya menemukan tutorial ini yang sangat membantu. Itu tidak menjawab semua bagian tetapi saya pikir ini adalah awal yang baik untuk diskusi: http://vikparuchuri.com/blog/intro-to-ensemble-learning-in-r/
sumber
Scikit-belajar ensembling panduan menyediakan mengantongi dan meningkatkan meta-pengklasifikasi dan regressors. Selain itu, pustaka mlxtend menyediakan implementasi stacking meta-classifiers dan regressor.
sumber