Prediktor Naif Bayes membuat prediksi menggunakan rumus ini:
di mana adalah faktor normalisasi. Ini membutuhkan estimasi parameter dari data. Jika kita melakukan ini dengan smoothing, maka kita mendapatkan estimasiP ( X i = x i | Y = y ) k
di mana ada nilai yang mungkin untuk . Saya baik-baik saja dengan ini. Namun, untuk yang sebelumnya, kami punyaX i
di mana ada contoh dalam kumpulan data. Kenapa kita tidak memuluskan sebelumnya? Atau lebih tepatnya, apakah kita menghaluskan yang sebelumnya? Jika ya, parameter smoothing apa yang kita pilih? Agak konyol juga untuk memilih , karena kita sedang melakukan perhitungan yang berbeda. Apakah ada konsensus? Atau tidak masalah?
sumber