Pemahaman saya tentang SVM adalah bahwa hal itu sangat mirip dengan regresi logistik (LR), yaitu sejumlah fitur tertimbang dilewatkan ke fungsi sigmoid untuk mendapatkan kemungkinan memiliki kelas, tetapi alih-alih kehilangan cross-entropy (logistik) fungsi, pelatihan dilakukan menggunakan engsel yang hilang. Manfaat menggunakan kehilangan engsel adalah bahwa seseorang dapat melakukan berbagai trik numerik untuk membuat kernelisasi lebih efisien. Namun, kelemahannya adalah bahwa model yang dihasilkan memiliki informasi lebih sedikit daripada yang dimiliki oleh model LR yang sesuai. Jadi, misalnya, tanpa kernelisation (menggunakan kernel linear) batas keputusan SVM masih akan berada di lokasi yang sama di mana LR akan menghasilkan probabilitas 0,5, TAPI seseorang tidak bisa mengatakan seberapa cepat kemungkinan menjadi bagian dari kelas meluruh menjauh dari batas keputusan.
Dua pertanyaan saya adalah:
- Apakah interpretasi saya di atas benar?
- Bagaimana cara menggunakan engsel kerugian membuatnya tidak valid untuk menafsirkan hasil SVM sebagai probabilitas?
sumber