Suntingan terakhir dengan semua sumber daya diperbarui:
Untuk sebuah proyek, saya menerapkan algoritma pembelajaran mesin untuk klasifikasi.
Tantangan: Data berlabel yang cukup terbatas dan lebih banyak lagi data yang tidak berlabel.
Tujuan:
- Terapkan klasifikasi semi-terawasi
- Terapkan proses pelabelan yang semi-diawasi (dikenal sebagai pembelajaran aktif)
Saya telah menemukan banyak informasi dari makalah penelitian, seperti menerapkan EM, Transductive SVM atau S3VM (Semi Supervised SVM), atau entah bagaimana menggunakan LDA, dll. Bahkan ada beberapa buku tentang topik ini.
Pertanyaan: Di mana implementasi dan sumber praktis?
Pembaruan akhir (berdasarkan bantuan yang diberikan oleh mpiktas, bayer, dan Marsupial Dikran)
Pembelajaran semi-diawasi:
- TSVM: dalam SVMligth dan SVMlin .
- EM Naif Bayes dengan Python
- EM dalam proyek LinePipe
Giat belajar:
- Dualist : implementasi pembelajaran aktif dengan kode sumber pada klasifikasi teks
- Halaman web ini menyajikan tinjauan luar biasa dari pembelajaran aktif.
- Lokakarya Desain eksperimental: di sini .
Pembelajaran mendalam:
- Video pengantar di sini .
- Situs umum .
- Tutorial Pembelajaran Fitur Stanford Unsupervised dan Deep Learning .
machine-learning
classification
software
svm
text-mining
Mengelupas
sumber
sumber
Jawaban:
Sepertinya pembelajaran mendalam mungkin sangat menarik bagi Anda. Ini adalah bidang model koneksionis yang sangat baru yang dipra-pra dengan cara yang tidak diawasi dan diperbaiki setelahnya dengan pengawasan. Penalaan yang bagus membutuhkan sampel yang jauh lebih sedikit daripada pretraining.
Untuk membasahi lidah Anda, saya sarankan [Semantig Hashing Salakhutdinov, Hinton . Lihatlah kode-kode yang ditemukan ini untuk dokumen-dokumen berbeda dari korpus Reuters: (tanpa pengawasan!)
Jika Anda memerlukan beberapa kode yang diimplementasikan, periksa deeplearning.net . Saya tidak percaya ada solusi di luar kotak.
sumber
Isabelle Guyon (dan kolega) mengorganisir tantangan untuk belajar aktif beberapa waktu lalu, prosesnya diterbitkan di sini (akses terbuka). Ini memiliki keuntungan karena cukup praktis dan Anda dapat langsung membandingkan kinerja berbagai pendekatan di bawah protokol yang tidak bias (dalam arti bahasa sehari-hari) (pemilihan pola acak secara mengejutkan sulit dikalahkan).
sumber
Ini daftar perpustakaan yang bagus.
http://www.infoworld.com/article/2608742/predictive-analytics/5-ways-to-add-machine-learning-to-java--javascript--and-more.html
sumber