Saya bukan ahli hutan acak tapi saya jelas mengerti bahwa masalah utama dengan hutan acak adalah generasi pohon (acak). Bisakah Anda jelaskan bagaimana pohon itu dihasilkan? (mis. Apa distribusi yang digunakan untuk pembuatan pohon?)
Terima kasih sebelumnya !
machine-learning
r
algorithms
cart
random-forest
robin girard
sumber
sumber
Gagasan utamanya adalah prosedur mengantongi, bukan membuat pohon acak. Secara rinci, setiap pohon dibangun di atas sampel objek yang digambar dengan penggantian dari set aslinya; dengan demikian setiap pohon memiliki beberapa objek yang belum dilihatnya, yang membuat keseluruhan ansambel lebih heterogen dan dengan demikian lebih baik dalam generalisasi.
Lebih jauh, pohon-pohon dilemahkan sedemikian rupa sehingga pada setiap pemisahan hanya M (atau
mtry
) atribut yang dipilih secara acak yang dipertimbangkan; M biasanya merupakan akar kuadrat dari jumlah atribut dalam himpunan. Ini memastikan bahwa pohon-pohonnya kurang dilengkapi, karena mereka tidak dipangkas. Anda dapat menemukan detail lebih lanjut di sini .Di sisi lain, ada varian RF yang disebut Extreme Random Forest, di mana pohon dibuat secara acak (tidak ada optimasi pemisahan) - lihat, saya pikir referensi ini .
sumber