Apa keunggulan atau properti yang menunjukkan bahwa masalah pembelajaran tertentu dapat diatasi dengan menggunakan mesin vektor dukungan?
Dengan kata lain, apa itu, ketika Anda melihat masalah belajar, membuat Anda pergi "oh saya pasti harus menggunakan SVM untuk ini '' daripada jaringan saraf atau pohon Keputusan atau apa pun?
supervised learning
tag, karena SVM juga dapat digunakan dalam masalah pembelajaran yang tidak diawasi .exception
Maksud Anda, itu hanya tweak dan bukan konvensi, kan?Jawaban:
SVM dapat digunakan untuk klasifikasi (membedakan antara beberapa kelompok atau kelas) dan regresi (memperoleh model matematika untuk memprediksi sesuatu). Mereka dapat diterapkan untuk masalah linier dan non linier.
Sampai 2006 mereka adalah algoritma tujuan umum terbaik untuk pembelajaran mesin. Saya mencoba menemukan makalah yang membandingkan banyak implementasi dari algoritma yang paling dikenal: svm, jaring saraf, pohon, dll. Saya tidak dapat menemukannya menyesal (Anda harus percaya padaku, hal buruk). Dalam makalah algoritma yang mendapatkan kinerja terbaik adalah svm, dengan libsvm perpustakaan.
Pada tahun 2006 Hinton datang dengan pembelajaran yang dalam dan jaring saraf. Dia meningkatkan keadaan saat ini dengan setidaknya 30%, yang merupakan kemajuan besar. Namun pembelajaran yang mendalam hanya mendapatkan kinerja yang baik untuk set pelatihan besar. Jika Anda memiliki satu set pelatihan kecil saya akan menyarankan untuk menggunakan svm.
Selanjutnya Anda dapat menemukan di sini infografis yang berguna tentang kapan harus menggunakan algoritma pembelajaran mesin yang berbeda dengan scikit-learn. Namun, sejauh pengetahuan saya tidak ada kesepakatan di antara komunitas ilmiah tentang jika masalah memiliki fitur X, Y dan Z maka lebih baik menggunakan svm. Saya akan menyarankan untuk mencoba metode yang berbeda. Juga, tolong jangan lupa bahwa svm atau jaring saraf hanyalah metode untuk menghitung model. Ini sangat penting juga fitur yang Anda gunakan.
sumber
Mari kita asumsikan bahwa kita berada dalam pengaturan klasifikasi.
Untuk
svm
rekayasa fitur adalah landasan:svm
kinerja menderita karena kami meningkatkan jumlah dimensi lebih cepat daripada metodologi lain (ansambel pohon). Ini karena masalah optimisasi terbatas yang mendukungsvm
s. Kadang pengurangan fitur layak, kadang tidak dan ini adalah saat kita tidak bisa membuka jalan untuk penggunaan yang efektifsvm
svm
kemungkinan akan kesulitan dengan dataset di mana jumlah fitur jauh lebih besar dari jumlah pengamatan. Ini, sekali lagi, dapat dipahami dengan melihat masalah optimizatiom terbatas.svm
algoritma.sumber