Hutan Acak tidak bisa berpakaian?

Hutan acak bisa cocok. Saya yakin akan hal ini. Apa yang biasanya dimaksud adalah bahwa model tidak akan cocok jika Anda menggunakan lebih banyak pohon.

Coba misalnya untuk memperkirakan model dengan hutan acak. Anda akan mendapatkan kesalahan pelatihan yang hampir nol tetapi kesalahan prediksi yang buruk $y = log(x) + \epsilon$

Donbeo
sumber

Random Forest pada prinsipnya mengurangi varians, bagaimana bisa overfit? @ Donbeo mungkinkah karena, model pohon keputusan tidak berkinerja baik pada ekstrapolasi. Katakanlah, untuk variabel prediktor anomali, DT dapat memberikan prediksi yang buruk.

Itachi

Salah satu indikasi yang jelas dari overfitting adalah bahwa varians residual berkurang terlalu banyak. Lalu, apa yang Anda maksudkan dengan komentar pertama Anda?

whuber

Dalam pertukaran bias-varians, ketika kami mencoba mengurangi bias, kami mengimbangi varians. Seperti itu, jika x = 80 memberi y = 100, tetapi x = 81 memberi y = -100. Ini akan terlalu pas . Tidak mirip dengan Ove karena memiliki varian tinggi. @whuber saya anggap ovefitting hanya karena varians yang tinggi. Saya tidak mengerti bagaimana mengurangi varians residual menghasilkan overfitting. Tolong bagikan beberapa kertas untuk saya baca.

Itachi

Ini tidak membutuhkan kertas apa pun! Anda bisa mencobanya sendiri. Ambil dataset sederhana bivariat kecil, seperti dan setiap koleksi yang sesuai Anda peduli untuk menghasilkan. Menggunakan kuadrat terkecil (karena ini bertujuan untuk mengurangi varians residu), pas dengan seri model untuk . Setiap langkah akan mengurangi varians sampai pada langkah terakhir varians adalah nol. Pada titik tertentu, hampir semua orang akan setuju, model sudah mulai menyesuaikan data.

x_{i} = 1, 2, \dots, 10

$x_i=1,2,\ldots,10$

y_{i}

$y_i$

y = β_{0} + β_{1} x + β_{2} x^{2} + \dots + β_{k} x^{k}

$y=\beta_0+\beta_1 x+\beta_2 x^2 + \cdots + \beta_k x^k$

k = 0, 1, \dots, 9

$k=0, 1, \ldots, 9$

whuber

@whuber Saya pikir Anda kehilangan titik tentang apa "pengurangan varian". Hutan Acak (dan mengantongi secara umum) tidak mengurangi varians residu, tetapi varians prediksi Anda. Jadi, dalam contoh Anda, setiap langkah Anda berbicara tentang varian MENINGKAT :)

Davide ND

Hutan Acak tidak bisa berpakaian?

Jawaban: