Saya mencoba mengevaluasi kinerja pengelompokan. Saya sedang membaca dokumentasi skiscit-learning tentang metrik . Saya tidak mengerti perbedaan antara ARI dan AMI. Tampak bagi saya bahwa mereka melakukan hal yang sama dalam dua cara berbeda.
Mengutip dari dokumentasi:
Mengingat pengetahuan tentang tugas kelas kebenaran ground label_true dan penugasan algoritma pengelompokan sampel sampel yang sama dengan label_pred, indeks Rand yang disesuaikan adalah fungsi yang mengukur kesamaan dari dua tugas, mengabaikan permutasi dan dengan normalisasi peluang.
vs.
Mengingat pengetahuan penugasan kelas kebenaran tanah label_true dan penugasan algoritma pengelompokan sampel sampel yang sama dengan label_pred, Informasi Mutual adalah fungsi yang mengukur perjanjian dua penugasan, mengabaikan permutasi ... AMI diusulkan baru-baru ini dan dinormalisasi terhadap kesempatan.
Haruskah saya menggunakan keduanya dalam evaluasi pengelompokan saya atau apakah ini berlebihan?
sumber
Jawaban:
Mereka adalah dua dari selusin yang semuanya mencoba membandingkan pengelompokan.
Tetapi mereka tidak setara. Mereka menggunakan teori yang berbeda.
Terkadang, ARI dapat lebih memilih satu hasil dan AMI yang lain. Tetapi seringkali mereka setuju dalam preferensi (bukan dalam angka).
sumber
Aturan praktisnya adalah:
Saya mengerjakan topik ini. Referensi: Menyesuaikan untuk Tindakan Perbandingan Clustering Peluang
sumber