Saya tertarik mengetahui apa yang sebenarnya terjadi di Hellinger Distance (dalam istilah sederhana). Selain itu, saya juga tertarik mengetahui jenis masalah apa yang bisa kita gunakan Hellinger Distance? Apa manfaat menggunakan Hellinger Distance?
machine-learning
data-mining
text-mining
distance
Smith Volka
sumber
sumber
Jawaban:
Jarak Hellinger adalah metrik untuk mengukur perbedaan antara dua distribusi probabilitas. Ini adalah analog probabilistik jarak Euclidean .
Diberikan dua distribusi probabilitas, dan , jarak Hellinger didefinisikan sebagai:QP Q
Ini berguna ketika mengukur perbedaan antara dua distribusi probabilitas. Misalnya, jika Anda memperkirakan distribusi untuk pengguna dan bukan pengguna layanan. Jika jarak Hellinger kecil antara kelompok-kelompok itu untuk beberapa fitur, maka fitur-fitur itu tidak berguna secara statistik untuk segmentasi.
sumber