Saya membaca Pembelajaran Mesin Langsung dengan Scikit-Learn dan TensorFlow: Konsep, Alat, dan Teknik untuk Membangun Sistem yang Cerdas . Maka saya tidak dapat menemukan perbedaan antara pemungutan suara keras dan pemungutan suara lunak dalam konteks untuk metode berbasis ansambel.
Saya mengutip deskripsi mereka dari buku. Dua gambar pertama dari atas adalah deskripsi untuk pemungutan suara keras, dan yang terakhir adalah untuk pemungutan suara lunak.
Dalam pandangan saya pemungutan suara keras adalah keputusan mayoritas, tetapi saya tidak mengerti pemungutan suara lunak dan alasan mengapa pemungutan suara lunak lebih baik daripada pemungutan suara keras. Adakah yang akan mengajari saya ini?
machine-learning
ensemble
gogogogogo
sumber
sumber
Jawaban:
Mari kita ambil contoh sederhana untuk menggambarkan bagaimana kedua pendekatan bekerja.
Bayangkan Anda memiliki 3 pengklasifikasi (1, 2, 3) dan dua kelas (A, B), dan setelah pelatihan Anda memprediksi kelas satu titik.
Voting keras
Prediksi :
2/3 pengklasifikasi memprediksi kelas B, jadi kelas B adalah keputusan ensembel .
Pemungutan suara lembut
Prediksi
(Ini identik dengan contoh sebelumnya, tetapi sekarang dinyatakan dalam probabilitas. Nilai yang ditampilkan hanya untuk kelas A di sini karena masalahnya adalah biner):
Peluang rata-rata untuk menjadi anggota kelas A di seluruh pengklasifikasi adalah
(99 + 49 + 49) / 3 = 65.67%
. Oleh karena itu, kelas A adalah keputusan ensembel .Jadi Anda dapat melihat bahwa dalam kasus yang sama, pemungutan suara yang lunak dan keras dapat menyebabkan keputusan yang berbeda. Pemungutan suara lunak dapat meningkat pada pemungutan suara keras karena memperhitungkan lebih banyak informasi; menggunakan ketidakpastian setiap classifier dalam keputusan akhir. Ketidakpastian yang tinggi dalam pengklasifikasi 2 dan 3 di sini pada dasarnya berarti bahwa keputusan ensemble akhir sangat bergantung pada classifier 1.
Ini adalah contoh ekstrem, tetapi tidak jarang ketidakpastian ini mengubah keputusan akhir.
sumber