Kapan saya seharusnya tidak menggunakan classifier ensemble?

17

Secara umum, dalam masalah klasifikasi di mana tujuannya adalah untuk secara akurat memprediksi keanggotaan kelas out-of-sample, kapan saya harus tidak menggunakan ensemble classifier?

Pertanyaan ini terkait erat dengan Mengapa tidak selalu menggunakan pembelajaran ensemble? . Pertanyaan itu menanyakan mengapa kita tidak menggunakan ansambel sepanjang waktu. Saya ingin tahu apakah ada kasus di mana ansambel dikenal lebih buruk (bukan hanya "tidak lebih baik dan buang-buang waktu") daripada yang setara dengan non-ansambel.

Dan dengan "ensemble classifier", saya secara khusus merujuk pada pengklasifikasi seperti AdaBoost dan hutan acak, sebagai lawan dari, misalnya, mesin vektor dukungan roll-your-boost Anda sendiri.

classification boosting ensemble bagging shadowtalker
sumber

2

Saya tidak akan menggunakan metode ensemble jika Anda tidak memiliki keragaman di antara metode individual. Dengan kata lain, ensemble berguna ketika Anda menggabungkan beragam metode.

peramal

2

@forecaster Saya tidak dapat membantu untuk menambahkan makalah yang sangat bagus tentang apa yang penulis sebut sebagai halaman keanekaragaman "baik" dan "buruk" .bangor.ac.uk/ ~mas00a/papers/gblkMCS10.pdf dalam konteks ansambel

Vladislavs Dovgalecs

n a t u r e

$nature$

b i o l o g i c a l l y i n s p i r e d

$biologically \ inspired$

7

Model yang paling dekat dengan proses menghasilkan data sejati akan selalu menjadi yang terbaik dan akan mengalahkan sebagian besar metode ansambel. Jadi, jika data berasal dari proses linear, lm () akan jauh lebih unggul daripada hutan acak, misalnya:

    set.seed(1234)
p=10
N=1000
#covariates
x = matrix(rnorm(N*p),ncol=p)
#coefficients:
b = round(rnorm(p),2)
y = x %*% b + rnorm(N)
train=sample(N, N/2)
data = cbind.data.frame(y,x)
colnames(data) = c("y", paste0("x",1:p))
#linear model
fit1 = lm(y ~ ., data = data[train,])
summary(fit1)
yPred1 =predict(fit1,data[-train,])
round(mean(abs(yPred1-data[-train,"y"])),2)#0.79

library(randomForest)
fit2 = randomForest(y ~ ., data = data[train,],ntree=1000)
yPred2 =predict(fit2,data[-train,])
round(mean(abs(yPred2-data[-train,"y"])),2)#1.33

Markus Loecher
sumber

13

Saya tidak merekomendasikan menggunakan classifier ensemble ketika model Anda perlu ditafsirkan dan dijelaskan. Terkadang Anda membutuhkan prediksi dan penjelasan prediksi.

Ketika Anda perlu meyakinkan orang bahwa prediksi itu layak untuk dipercaya, model yang sangat akurat bisa sangat persuasif, tetapi saya telah berjuang untuk meyakinkan orang untuk bertindak berdasarkan prediksi ketika metode terlalu kompleks untuk tingkat kenyamanan mereka.

Dalam pengalaman saya, kebanyakan orang merasa nyaman dengan model aditif linier, model yang mereka dapat nilai dengan tangan, dan jika Anda mencoba menjelaskan peningkatan adaptif, hyper-pesawat dan efek interaksi tingkat 5 mereka akan merespons seolah-olah Anda melempar mereka ilmu hitam.

Di sisi lain, orang dapat merasa nyaman dengan kerumitan model, tetapi masih ingin menginternalisasi beberapa wawasan. Para ilmuwan, misalnya, mungkin tidak menganggap model kotak hitam sebagai kemajuan dalam pengetahuan manusia, bahkan jika model tersebut sangat akurat.

Analisis kepentingan variabel dapat membantu dengan wawasan, tetapi jika ansambel lebih akurat daripada model aditif linier, ansambel mungkin mengeksploitasi beberapa efek non-linear dan interaksi yang analisis kepentingan variabel tidak dapat sepenuhnya menjelaskan.

brandco
sumber

Bukan apa yang saya kejar, tapi poin bagus. 1

shadowtalker

3

Saya ingin menambahkan jawaban branco. Ansambel dapat sangat kompetitif dan memberikan hasil yang sangat baik. Dalam dunia akademis misalnya, inilah yang terpenting. Dalam industri, ansambel mungkin terlalu sulit untuk mengimplementasikan / memelihara / memodifikasi / port. Karya Goef Hinton tentang "Pengetahuan Gelap" persis tentang ini: bagaimana mentransfer "pengetahuan" dari ansambel besar menjadi satu model yang mudah untuk dipindahkan. Dia menyatakan bahwa ansambel buruk pada waktu ujian: mereka sangat redundan dan waktu komputasi dapat menjadi perhatian.

Timnya mendapat beberapa hasil yang menarik, saya sarankan untuk memeriksa publikasi atau setidaknya slide-nya. Jika ingatan saya baik, ini adalah salah satu topik hangat tahun 2013 atau 2014.

Slide tentang Pengetahuan Gelap dapat ditemukan di sini: http://www.ttic.edu/dl/dark14.pdf

Vladislavs Dovgalecs
sumber

Kapan saya seharusnya tidak menggunakan classifier ensemble?

Jawaban: