Saya menemukan koefisien Dice untuk kesamaan volume ( https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefisien ) dan akurasi ( https://en.wikipedia.org/wiki/Accuracy_and_precision) ).
Tampak bagi saya bahwa kedua ukuran ini sama. Adakah pikiran?
descriptive-statistics
roc
accuracy
precision-recall
auc
RockTheStar
sumber
sumber
Jawaban:
Ini bukan hal yang sama dan sering digunakan dalam konteks yang berbeda. Skor Dice sering digunakan untuk mengukur kinerja metode segmentasi gambar . Di sana Anda membubuhi keterangan beberapa wilayah kebenaran dasar dalam gambar Anda dan kemudian membuat algoritma otomatis untuk melakukannya. Anda memvalidasi algoritma dengan menghitung skor Dice, yang merupakan ukuran seberapa mirip objek. Jadi itu adalah ukuran tumpang tindih dari dua segmentasi dibagi dengan ukuran total dari dua objek. Menggunakan istilah yang sama dengan menggambarkan akurasi, skor Dice adalah:Skor dadu= 2 ⋅ jumlah positif sebenarnya2 ⋅ jumlah positif sejati + jumlah positif palsu + jumlah negatif palsu
Jadi jumlah positif sejati, adalah jumlah yang ditemukan metode Anda, jumlah positif adalah jumlah total positif yang dapat ditemukan dan jumlah palsu positif adalah jumlah poin yang negatif bahwa metode Anda diklasifikasikan sebagai positif.
Skor Dice tidak hanya mengukur berapa banyak positif yang Anda temukan, tetapi juga menghukum positif palsu yang ditemukan metode ini, mirip dengan presisi. jadi lebih mirip dengan presisi daripada akurasi. Satu-satunya perbedaan adalah penyebutnya, di mana Anda memiliki jumlah total positif daripada hanya positif yang ditemukan metode ini. Jadi skor Dice juga menghukum positif yang tidak ditemukan algoritma / metode Anda.
Sunting: Dalam hal segmentasi gambar, misalkan Anda memiliki topeng dengan kebenaran dasar, mari kita sebut topengSEBUAH seperti yang Anda sarankan. Jadi topeng memiliki nilai 1 dalam piksel di mana ada sesuatu yang Anda coba temukan dan nol. Sekarang Anda memiliki algoritma untuk menghasilkan gambar / topeng B , yang juga harus menjadi gambar biner, yaitu Anda membuat topeng untuk segmentasi Anda. Maka kita memiliki yang berikut:
Jika Anda melakukan ini untuk publikasi, maka tulislah Dadu dengan huruf besar D, karena ini dinamai setelah seorang pria bernama Dice.
EDIT: Mengenai komentar tentang koreksi: Saya tidak menggunakan rumus tradisional untuk menghitung koefisien Dice, tetapi jika saya menerjemahkannya ke notasi di jawaban lain itu menjadi:
Yang setara dengan definisi tradisional. Lebih mudah untuk menuliskannya dengan cara yang saya tulis semula untuk menyatakan rumus dalam hal positif palsu. Backslash adalah minus yang ditetapkan.
sumber
The koefisien Dice (juga dikenal sebagai indeks kesamaan Dice) adalah sama dengan skor F1 , tapi itu tidak sama dengan akurasi. Perbedaan utama mungkin adalah fakta bahwa akurasi memperhitungkan negatip benar negatif sedangkan koefisien Dice dan banyak tindakan lain hanya menangani negatip sebenarnya sebagai default yang tidak menarik (lihat Dasar-Dasar Evaluasi Klasifikasi, Bagian 1 ).
Sejauh yang saya tahu, koefisien Dice tidak dihitung seperti yang dijelaskan oleh jawaban sebelumnya , yang sebenarnya mengandung rumus untuk indeks Jaccard (juga dikenal sebagai "persimpangan atas persatuan" dalam visi komputer).
Koefisien Dice dan indeks Jaccard terkait secara monoton, dan indeks Tversky menggeneralisasikan keduanya, untuk membaca lebih lanjut tentang itu lihat kesamaan skor-F, Dice, dan Jaccard .
Koefisien Dice juga merupakan rata-rata harmonik dari Sensitivitas dan Presisi, untuk melihat mengapa itu masuk akal, baca Mengapa F-Measure merupakan rata-rata harmonik dan bukan rata-rata aritmatika dari pengukuran Precision and Recall? .
Untuk membaca lebih lanjut tentang banyak istilah dalam jawaban ini dan hubungannya, lihat Evaluasi pengklasifikasi biner .
sumber