Pohon keputusan yang dikuatkan dikalibrasi dalam R atau MATLAB

8

Dalam Perbandingan Empiris Algoritma Pembelajaran yang Dibimbing (ICML 2006), penulis (Rich Caruana dan Alexandru Niculescu-Mizil) mengevaluasi beberapa algoritma klasifikasi (SVM, ANN, KNN, Hutan Acak, Pohon Keputusan, dll.), Dan melaporkan bahwa pohon-pohon yang dikalibrasi dikalibrasi peringkat sebagai algoritma pembelajaran terbaik secara keseluruhan di delapan metrik yang berbeda (F-score, Area ROC, presisi rata-rata, cross-entropy, dll.).

Saya ingin menguji pohon keputusan terdorong dikalibrasi di salah satu proyek saya, dan bertanya-tanya apakah ada yang bisa menyarankan paket R yang baik atau perpustakaan MATLAB untuk ini.

Saya relatif baru untuk R, meskipun saya memiliki pengalaman besar dengan MATLAB dan Python. Saya telah membaca tentang gbm , tree , dan rpart R, tetapi saya tidak yakin apakah paket-paket ini mengimplementasikan pohon keputusan yang dikalibrasi yang dikalibrasi atau jika ada orang lain yang mengimplementasikannya.

Terima kasih

Amelio Vazquez-Reina
sumber

Jawaban:

3

Tentang R, saya akan memilih paket gbm ; ada sketsa yang memberikan ikhtisar yang baik: Generalized Boosted Models: Panduan untuk paket gbm . Jika Anda mencari antarmuka terpadu untuk algoritme ML, saya merekomendasikan paket caret yang memiliki fasilitas bawaan untuk pemrosesan data, resampling, dan penilaian komparatif kinerja model. Paket-paket lain untuk pohon-pohon yang dikuatkan dilaporkan pada Tabel 1 dari salah satu sketsa yang menyertainya, penyetelan model, fungsi prediksi dan kinerja . Ada juga contoh penyetelan parameter untuk pohon yang dikuatkan di kertas JSS , hlm. 10-11.

Catatan: Saya tidak memeriksa, tetapi Anda juga dapat melihat Weka (ada antarmuka R, RWeka ).

chl
sumber
1
Terima kasih @chl. Saya akan melihat mereka. Apakah Anda tahu jika ada dari paket-paket ini yang menyediakan keluaran terkalibrasi? (yaitu probabilitas dikalibrasi, bukan hanya skor)
Amelio Vazquez-Reina
1
Saya memahami pertanyaannya sebagai: "Apakah penskalaan platt atau metode regresi isotonik telah diterapkan dalam R?"
charles
@ user023472 Apakah Anda pernah menemukan jawaban untuk masalah ini?
charles