Menggunakan SVM sebagai pengklasifikasi biner, apakah label untuk titik data dipilih oleh konsensus?

9

Saya sedang belajar Dukungan Mesin Vektor , dan saya tidak dapat memahami bagaimana label kelas dipilih untuk titik data dalam pengklasifikasi biner. Apakah dipilih berdasarkan konsensus sehubungan dengan klasifikasi di setiap dimensi hyperplane pemisah?

gc5
sumber

Jawaban:

9

Istilah konsensus , sejauh yang saya ketahui, lebih digunakan untuk kasus ketika Anda memiliki lebih dari satu sumber metrik / ukuran / pilihan untuk mengambil keputusan. Dan, untuk memilih hasil yang mungkin, Anda melakukan beberapa evaluasi / konsensus rata-rata atas nilai-nilai yang tersedia.

Ini bukan kasus untuk SVM. Algoritma ini didasarkan pada optimasi kuadratik , yang memaksimalkan jarak dari dokumen terdekat dari dua kelas yang berbeda, menggunakan hyperplane untuk membuat pemisahan.

Hyperplane memisahkan dua kelas yang berbeda

Jadi, satu-satunya konsensus di sini adalah hyperplane yang dihasilkan, dihitung dari dokumen terdekat dari masing-masing kelas. Dengan kata lain, kelas dikaitkan dengan setiap titik dengan menghitung jarak dari titik ke hyperplane yang diturunkan. Jika jaraknya positif, itu milik kelas tertentu, jika tidak, itu milik kelas lain.

Rubens
sumber