Meskipun saya dilatih sebagai seorang insinyur, saya menemukan bahwa saya menjadi lebih tertarik pada data mining. Saat ini saya sedang mencoba untuk menyelidiki bidang ini lebih lanjut. Secara khusus, saya ingin memahami berbagai kategori alat perangkat lunak yang ada dan alat mana yang menonjol di setiap kategori dan mengapa. (Perhatikan bahwa saya tidak mengatakan alat "terbaik", hanya yang terkenal jangan sampai kita memulai perang api.) Terutama buat catatan tentang alat yang open-source dan tersedia secara bebas - meskipun tidak menganggap ini berarti bahwa Saya hanya tertarik pada open-source dan gratis.
data-mining
John Berryman
sumber
sumber
Jawaban:
Ini mungkin daftar paling lengkap yang akan Anda temukan: mloss.org
sumber
Lihatlah
dan Repositori Pembelajaran Mesin UCI untuk set data.
sumber
Rattle adalah GUI penambangan data yang menyediakan ujung depan untuk berbagai paket R.
sumber
Lihatlah KNIME .
Sangat mudah dipelajari. Dengan banyak ruang untuk kemajuan lebih lanjut. Terintegrasi dengan baik dengan Weka dan R.
sumber
Dari perspektif popularitas, makalah ini (2008) mensurvei 10 algoritma teratas dalam penambangan data .
sumber
RapidMiner (Java) [open source]
sumber
Ada ELKI , proyek universitas open-source yang agak sebanding dengan WEKA, tetapi jauh lebih kuat dalam hal pengelompokan dan deteksi outlier. WEKA sebenarnya bukan benar-benar data mining, tetapi perangkat lunak pembelajaran mesin.
sumber
Ada Red-R ini yang memiliki GUI yang bagus dan antarmuka pemrograman visual. Itu menggunakan R untuk memproses berbagai analisis data.
sumber
Rexer Anlaytics melakukan survei toolkit setiap tahun. KDnuggets memiliki deskripsi perangkat lunak berdasarkan industri dan juga maksudnya.
sumber
SQL Server Data Mining (SSDM) belum diperbarui dalam waktu yang lama, tetapi masih cukup kompetitif jika Anda menambang basis data relasional besar dan kubus. Saya pelan-pelan tetapi secara sistematis bekerja keras melalui pengujian alat penambangan sebanyak yang saya bisa dan antarmuka Windows SQL Server adalah yang paling produktif dan stabil yang saya temukan sampai saat ini (terutama ketika datang ke database perusahaan, beberapa di antaranya secara mengejutkan antarmuka ceroboh) meskipun usianya. Saya lebih suka antarmuka Windows Presentation Foundation (WPF) modern tetapi ini adalah hal terbaik berikutnya.
Saya menulis serangkaian tutorial amatir terperinci di atasnya berjudul A Rickety Stairway ke SQL Server Data Mining , ketika saya mencoba untuk mendapatkan beberapa keterampilan dasar penambangan. Meskipun pengalaman saya kurang, mereka masih berguna dalam membantu mengidentifikasi beberapa "gotcha" di muka.
sumber