Breiman mengatakan bahwa pohon-pohon ditanam tanpa pemangkasan. Mengapa? Maksud saya mengatakan bahwa harus ada alasan kuat mengapa pohon-pohon di hutan acak tidak dipangkas. Di sisi lain itu dianggap sangat penting untuk memangkas pohon keputusan tunggal untuk menghindari pas. Apakah ada bacaan yang tersedia untuk dibaca karena alasan ini? Tentu saja pohon mungkin tidak berkorelasi tetapi masih ada kemungkinan terlalu pas.
machine-learning
Z Khan
sumber
sumber
Jawaban:
Secara kasar, beberapa potensi over-fitting yang mungkin terjadi dalam satu pohon (yang merupakan alasan Anda melakukan pemangkasan umumnya) dimitigasi oleh dua hal di Hutan Acak:
Sunting: berdasarkan komentar OP di bawah ini:
Pasti masih ada potensi untuk over-fitting. Sejauh artikel, Anda dapat membaca tentang motivasi untuk "mengantongi" oleh Breiman dan "bootstrap" secara umum oleh Efron dan Tibshirani. Sejauh 2., Brieman memperoleh batasan longgar pada kesalahan generalisasi yang terkait dengan kekuatan pohon dan anti-korelasi dari masing-masing pengklasifikasi. Tidak ada yang menggunakan batasan (kemungkinan besar) tetapi ini dimaksudkan untuk memberikan intuisi tentang apa yang membantu kesalahan generalisasi rendah dalam metode ensemble. Ini ada di kertas Random Forests sendiri. Posting saya adalah untuk mendorong Anda ke arah yang benar berdasarkan pembacaan ini dan pengalaman / deduksi saya.
sumber