Apa yang terjadi ketika kita melatih mesin vektor dukungan dasar (kernel linear dan tidak ada margin lunak) pada data yang dapat dipisahkan secara non-linear? Masalah optimisasi tidak layak, jadi apa yang dihasilkan oleh algoritma minimisasi?
Apa yang terjadi ketika kita melatih mesin vektor dukungan dasar (kernel linear dan tidak ada margin lunak) pada data yang dapat dipisahkan secara non-linear? Masalah optimisasi tidak layak, jadi apa yang dihasilkan oleh algoritma minimisasi?
Saya pikir dukungan dasar mesin vektor berarti SVM hard-margin. Jadi, mari kita tinjau:
Singkatnya, kami ingin menemukan hyperplane dengan margin terbesar yang dapat memisahkan semua pengamatan dengan benar di ruang sampel pelatihan kami.
Dengan definisi di atas, apa masalah optimasi yang perlu kita selesaikan?
max(margin)
margin
dan juga memenuhi batasan: Tidak ada kesalahan dalam sampelKembali ke pertanyaan Anda, karena Anda menyebutkan kumpulan data pelatihan tidak dapat dipisahkan secara linear, dengan menggunakan SVM hard-margin tanpa transformasi fitur, tidak mungkin menemukan hyperplane yang memenuhi "Tidak ada kesalahan dalam sampel" .
Biasanya, kami menyelesaikan masalah optimasi SVM dengan Quadratic Programming, karena dapat melakukan tugas-tugas optimasi dengan kendala. Jika Anda menggunakan Gradient Descent atau algoritme pengoptimalan lain yang tanpa memenuhi batasan SVM hard-margin, Anda tetap harus mendapatkan hasilnya, tetapi itu bukan hyperplane SVM hard-margin.
Omong-omong, dengan data yang dapat dipisahkan secara non-linear, biasanya kita memilih