Hutan Acak (RF) dibuat oleh ensemble dari Decision Trees's (DT). Dengan menggunakan bagging, setiap DT dilatih dalam subset data yang berbeda. Oleh karena itu, adakah cara menerapkan hutan acak online dengan menambahkan lebih banyak keputusan pengambilan data baru?
Sebagai contoh, kami memiliki sampel 10K dan melatih 10 DT. Kemudian kami mendapatkan sampel 1K, dan alih-alih melatih lagi RF lengkap, kami menambahkan DT baru. Prediksi ini dilakukan sekarang oleh rata-rata Bayesian 10 + 1 DT.
Selain itu, jika kita menyimpan semua data sebelumnya, DT baru dapat dilatih terutama dalam data baru, di mana probabilitas memilih sampel tertimbang tergantung berapa kali telah diambil.
sumber