Saya sedang mempertimbangkan untuk membangun antarmuka MATLAB dan R ke Ross Quinlan 's C5.0 (bagi mereka yang tidak terbiasa dengannya, C5.0 adalah paket algoritma pohon keputusan dan perangkat lunak; perpanjangan C4.5 ), dan saya mencoba untuk mendapatkan rasa komponen yang perlu saya tulis.
Satu-satunya dokumentasi yang saya temukan untuk C5.0 ada di sini , yang merupakan tutorial untuk See5 (antarmuka Windows ke C5.0?). File tar dilengkapi dengan Makefile, tetapi tidak ada file Readme atau dokumentasi tambahan apa pun.
Dari apa yang saya baca di tutorial di atas, C5.0 menggunakan representasi berbasis ASCII untuk menangani input dan output, dan saya juga mempertimbangkan untuk membangun antarmuka yang melewati data biner langsung antara MATLAB atau R dan C5.0. Apakah representasi data C5.0 digunakan oleh perangkat lunak pembelajaran mesin / klasifikasi lainnya?
Adakah yang pernah mencoba membangun MATLAB atau antarmuka R ke ID3, C4.5 atau C5.0 sebelumnya?
Terima kasih
sumber
Jawaban:
Itu terdengar seperti ide bagus, terutama karena halaman yang Anda tautkan menunjukkan bahwa C5.0 sekarang berada di bawah GPL.
Saya punya beberapa pengalaman membungkus perangkat lunak C / C ++ ke R menggunakan Rcpp ; Saya akan dengan senang hati membantu.
sumber
Menghubungkan kode C / C ++ ke MATLAB cukup mudah, yang harus Anda lakukan adalah membuat fungsi gateway MEX untuk menangani konversi parameter dan mengembalikan parameter. Saya memiliki pengalaman dalam membuat file MEX untuk melakukan hal semacam ini dan dengan senang hati akan membantu.
sumber
MEMPERBARUI:
Sekarang di CRAN:
http://cran.r-project.org/web/packages/C50/index.html
ASLI:
Kami telah mengerjakan ini sedikit sekarang (dimulai dengan Cubist kemudian bekerja pada C5.0).
Jika Anda ingin berkontribusi:
https://r-forge.r-project.org/projects/rulebasedmodels/
dibuat baru-baru ini dan kami harus memeriksa kode awal di.
Kami telah memiliki akses ke sumber Cubist untuk sementara waktu sekarang (tetapi ada perjanjian eksplisit untuk tidak menautkannya ke sw lainnya) dan telah memperdebatkan berbagai opsi untuk memasukkan kode, tapi saya yakin
sumber
Dokumentasi C5.0 (Linux) ada di http://rulequest.com/see5-unix.html
sumber