Hein,
ada banyak alat dan lib dengan fungsi yang tersedia.
Yang akan dipilih tergantung apakah Anda ingin menggunakan gui untuk pekerjaan Anda atau jika Anda ingin menanamkannya di beberapa program lain.
Alat penambangan data mandiri (ada ohters seperti WEKA dengan antarmuka Java):
- Penambang cepat
- jeruk
- Rattle gui untuk R
- KNIME
Berbasis teks:
Libs:
- Scikit untuk Python
- Mahout di Hadoop
Jika Anda tahu bahasa pemrograman dengan cukup baik, saya akan menggunakan lib untuk bahasa itu atau mencoba R. Jika tidak, Anda dapat mencoba salah satu alat dengan gui.
Contoh pohon dalam R:
# we are using the iris dataset
data(iris)
# for our tree based model we use the rpart package
# to download it type install.packages("rpart")
library(rpart)
# Building the tree
fit <- rpart(Species ~ Petal.Length + Petal.Width, method="class", data=iris)
# Plot the tree
plot(fit)
text(fit)
Seperti yang disarankan analisis dengan R mengharuskan Anda untuk membuat kode sendiri, tetapi Anda akan menemukan paket untuk sebagian besar tugas klasifikasi yang akan bekerja di luar kotak. Gambaran umum dapat ditemukan di sini Tampilan Tugas Pembelajaran Mesin
Untuk memulai dengan RapidMinder, Anda harus melihat di Youtube. Ada beberapa screencast, bahkan untuk pohon keputusan.
Weka adalah perangkat pembelajaran mesin gratis dan open source. Mereka memiliki GUI serta API untuk melakukan panggilan dari kode Java Anda jika Anda mau.
Mereka memiliki banyak algoritma klasifikasi termasuk beberapa algoritma pohon keputusan. Ini tersedia di UI. Tetangga terdekat sedikit lebih rumit dan sepertinya Anda harus menggunakan API secara langsung .
Saya pikir Rapid Miner mungkin mendukung hal semacam ini, tetapi saya belum pernah menggunakannya untuk tujuan seperti itu sebelumnya.
Anda mungkin juga mempertimbangkan R , tetapi itu mungkin mengharuskan tangan Anda sedikit lebih kotor.
Perhatikan bahwa Netflix telah melakukan banyak pekerjaan dalam klasifikasi peringkat film. Beberapa tahun yang lalu mereka menawarkan hadiah $ 1 juta kepada grup yang dapat meningkatkan klasifikasi mereka. Anda mungkin tertarik membaca bagaimana berbagai tim mendekati masalah itu.
sumber
Mungkin ... WEKA? http://www.cs.waikato.ac.nz/ml/weka/
sumber