Baru-baru ini saya telah menggunakan penskalaan Platt untuk keluaran-SVM untuk memperkirakan probabilitas peristiwa-standar. Alternatif yang lebih langsung sepertinya adalah "Kernel logistic Regression" (KLR) dan "Import Vector Machine" terkait.
Adakah yang bisa mengatakan metode kernel mana yang memberikan probabilitas-keluaran saat ini canggih? Apakah ada R-implementasi KLR?
Terima kasih banyak atas bantuan Anda!
logistic
svm
kernel-trick
RichardN
sumber
sumber
Jawaban:
Klasifikasi proses Gaussian (menggunakan Propagasi Ekspektasi) mungkin adalah yang paling mutakhir dalam pembelajaran mesin. Ada buku yang sangat bagus oleh Rasmussen dan Williams (dapat diunduh gratis), situs web yang memiliki implementasi MATLAB yang sangat baik. Lebih banyak perangkat lunak, buku, makalah, dll . Di sini . Namun, dalam praktiknya, KLR mungkin akan berfungsi dengan baik untuk sebagian besar masalah, kesulitan utama adalah dalam memilih parameter kernel dan regularisasi, yang mungkin paling baik dilakukan dengan validasi silang, meskipun validasi silang keluar-keluar-keluar dapat diperkirakan. sangat efisien, lihat Cawley dan Talbot (2008).
sumber
Saya kira Anda tahu bahwa kernel untuk regresi logistik adalah non parametrik, jadi pertama-tama Anda memiliki batasan itu.
Mengenai paket R yang saya tahu dan bekerja cukup baik adalah np : Metode smoothing kernel nonparametric untuk tipe data campuran
Paket ini menyediakan berbagai metode kernel nonparametrik (dan semiparametri) yang secara mulus menangani campuran tipe data faktor kontinu, tidak berurutan, dan terurut.
Mengenai keadaan seni kernel saya dapat merekomendasikan untuk bereksperimen dengan yang dijelaskan dalam makalah ini dari 2009. Baca dengan cermat untuk memilih salah satu yang terbaik dan lebih aktual untuk Anda.
sumber