Saya mencoba memahami perbedaan utama antara GBM dan XGBOOST. Saya mencoba untuk google itu, tetapi tidak dapat menemukan jawaban yang baik menjelaskan perbedaan antara kedua algoritma dan mengapa xgboost hampir selalu berkinerja lebih baik daripada GBM. Apa yang membuat XGBOOST begitu cepat?
machine-learning
algorithms
xgboost
ensemble-modeling
gbm
Seorang pria
sumber
sumber
Jawaban:
Kutipan dari penulis
xgboost
:Sunting: Ada panduan terperinci xgboost yang menunjukkan lebih banyak perbedaan.
Referensi
https://www.quora.com/What-is-the-difference-between-the-R-gbm-gradient-boosting-machine-and-xgboost-extreme-gradient-boosting
https://xgboost.readthedocs.io/en/latest/tutorials/model.html
sumber
Selain jawaban yang diberikan oleh Icyblade, para pengembang xgboost telah membuat sejumlah peningkatan kinerja penting ke berbagai bagian implementasi yang membuat perbedaan besar dalam kecepatan dan pemanfaatan memori:
Dalam pengalaman saya ketika menggunakan GBM dan xgboost saat melatih dataset besar (5 juta + catatan), saya telah mengalami pemanfaatan memori yang berkurang secara signifikan (dalam R) untuk dataset yang sama dan menemukan lebih mudah untuk menggunakan banyak core untuk mengurangi waktu pelatihan.
sumber
Satu perbedaan yang sangat penting adalah
xgboost
telah menerapkan DART, regularisasi putus sekolah untuk pohon regresi .Referensi
Rashmi, KV, & Gilad-Bachrach, R. (2015). Dart: Putus sekolah bertemu beberapa pohon regresi aditif. arXiv preprint arXiv: 1505.01866.
sumber
Saya pikir perbedaan antara meningkatkan gradien dan Xgboost adalah dalam xgboost algoritma berfokus pada kekuatan komputasi, dengan cara memaralelkan formasi pohon yang dapat dilihat di blog ini .
Peningkatan gradien hanya berfokus pada varians tetapi bukan trade off antara bias sedangkan xg boost juga dapat fokus pada faktor regularisasi.
sumber
Implementasi XGBoost bermasalah. Hancur secara diam-diam saat berlatih menggunakan GPU pada v 082 . Itu terjadi pada saya juga pada v 0.90 , jadi masalah ini belum diatasi sejauh ini, dan "perbaikan" yang disediakan di GitHub tidak bekerja untuk saya.
LGBM 2.3.1 bekerja seperti pesona di luar kotak, meskipun menginstalnya membutuhkan sedikit usaha. Sejauh ini tidak ada masalah pelatihan pada GPU.
Tentang XGBoost karena " begitu cepat ", Anda harus melihat pada tolok ukur ini .
sumber