Menafsirkan estimasi kesalahan kantong untuk RandomForestRegressor

9

Saya menggunakan regresi RandomForest pada data saya dan saya bisa melihat bahwa skor oob diperoleh menjadi 0,83. Saya tidak yakin bagaimana hasilnya menjadi seperti ini. Maksud saya target saya adalah nilai tinggi di kisaran 10 ^ 7. Jadi jika itu MSE maka seharusnya jauh lebih tinggi. Saya tidak mengerti apa artinya 0,83 di sini.

Saya menggunakan RandomForestRegressor python dari toolkit sklearn.

Saya lakukan

model = RandomForestRegressor (max_depth = 7, n_estimators = 100, oob_score = Benar, n_jobs = -1) model.fit (trainX, trainY)

Lalu saya melihat model.oob_score_ dan saya mendapatkan nilai seperti 0.83809026152005295

pengguna34790
sumber
@Momo. Saya menggunakan RandomForestRegressor dari pyleon's sklearn.ensemble. Saya hanya menggunakan model seperti
user34790

Jawaban:

6

Untuk membandingkan kebenaran target (yaitu benar / aktual) dengan nilai target estimasi (yaitu prediksi) oleh hutan acak, scikit-learn tidak menggunakan MSE tetapi (tidak seperti misalnya MATLAB atau ( Breiman 1996b ) ), seperti yang Anda lihat di kode forest.py :R2

self.oob_score_ = 0.0
for k in xrange(self.n_outputs_):
    self.oob_score_ += r2_score(y[:, k], predictions[:, k])
self.oob_score_ /= self.n_outputs_

r2_score()menghitung koefisien determinasi alias. R2 , yang skor terbaiknya adalah 1.0, dan nilai yang lebih rendah lebih buruk.

FYI:

Franck Dernoncourt
sumber