Melakukan penelitian tentang algoritma xgboost saya membaca dokumentasi .
Dalam pendekatan ini, pohon diatur menggunakan definisi kompleksitas mana dan adalah parameter, adalah jumlah daun terminal dan adalah skor di setiap daun.
Saya bertanya-tanya: bagaimana ini mendefinisikan kompleksitas? , jumlah node terminal, tampak alami bagi saya. Tetapi jumlah skor akhir kuadrat?
Mungkin overfitting yang dimaksud. Berarti skor yang sangat besar memberi terlalu banyak kepercayaan diri? Apakah itu dipilih untuk mendapatkan pembelajar yang lemah? Apa penjelasan alami untuk pilihan fungsi kompleksitas ini?