Masalah
Saya telah mencoba menggunakan bayang naif pada set data berlabel data kejahatan tetapi mendapat hasil yang sangat buruk (akurasi 7%). Naif Bayes berjalan jauh lebih cepat daripada alogoritma lain yang telah saya gunakan, jadi saya ingin mencoba mencari tahu mengapa nilainya sangat rendah.
Penelitian
Setelah membaca saya menemukan bahwa Naif bayes harus digunakan dengan dataset yang seimbang karena memiliki bias untuk kelas dengan frekuensi yang lebih tinggi. Karena data saya tidak seimbang, saya ingin mencoba menggunakan Complementary Naive Bayes karena ini khusus dibuat untuk berurusan dengan kemiringan data. Dalam makalah yang menjelaskan prosesnya, aplikasi ini untuk klasifikasi teks tetapi saya tidak melihat mengapa teknik ini tidak berfungsi dalam situasi lain. Anda dapat menemukan makalah yang saya maksud di sini . Singkatnya idenya adalah menggunakan bobot berdasarkan kejadian di mana kelas tidak muncul.
Setelah melakukan beberapa penelitian saya dapat menemukan implementasi di Jawa tetapi sayangnya saya tidak tahu Jawa dan saya hanya tidak mengerti algoritma dengan cukup baik untuk mengimplementasikan sendiri.
Pertanyaan
di mana saya dapat menemukan implementasi dalam python? Jika itu tidak ada, bagaimana saya harus menerapkannya sendiri?
Implementasi saya dari Complement Naif Bayes di scikit-learn dapat ditemukan di sini .
sumber