Apakah koefisien Dice sama dengan akurasi?

Saya menemukan koefisien Dice untuk kesamaan volume ( https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefisien ) dan akurasi ( https://en.wikipedia.org/wiki/Accuracy_and_precision) ).

Tampak bagi saya bahwa kedua ukuran ini sama. Adakah pikiran?

descriptive-statistics roc accuracy precision-recall auc RockTheStar
sumber

Ini memberikan semua informasi stats.stackexchange.com/questions/195006/…

peringkat1

@ rank1 Terima kasih. Saya ingin mengklarifikasi: bukankah itu tautan ke pertanyaan saya :)

RockTheStar

ooops, yang ini: ncbi.nlm.nih.gov/pmc/articles/PMC4533825

rank1

Jawaban:

Ini bukan hal yang sama dan sering digunakan dalam konteks yang berbeda. Skor Dice sering digunakan untuk mengukur kinerja metode segmentasi gambar . Di sana Anda membubuhi keterangan beberapa wilayah kebenaran dasar dalam gambar Anda dan kemudian membuat algoritma otomatis untuk melakukannya. Anda memvalidasi algoritma dengan menghitung skor Dice, yang merupakan ukuran seberapa mirip objek. Jadi itu adalah ukuran tumpang tindih dari dua segmentasi dibagi dengan ukuran total dari dua objek. Menggunakan istilah yang sama dengan menggambarkan akurasi, skor Dice adalah:

Skor dadu = \frac{2 \cdot jumlah positif sejati}{2 \cdot jumlah positif sejati + jumlah positif palsu + jumlah negatif palsu}

$\text{Dice score} = \frac{2\cdot \text{number of true positives}}{2 \cdot \text{number of true positives + number of false positives + number of false negatives}}$ Jadi jumlah positif sejati, adalah jumlah yang ditemukan metode Anda, jumlah positif adalah jumlah total positif yang dapat ditemukan dan jumlah palsu positif adalah jumlah poin yang negatif bahwa metode Anda diklasifikasikan sebagai positif.

Skor Dice tidak hanya mengukur berapa banyak positif yang Anda temukan, tetapi juga menghukum positif palsu yang ditemukan metode ini, mirip dengan presisi. jadi lebih mirip dengan presisi daripada akurasi. Satu-satunya perbedaan adalah penyebutnya, di mana Anda memiliki jumlah total positif daripada hanya positif yang ditemukan metode ini. Jadi skor Dice juga menghukum positif yang tidak ditemukan algoritma / metode Anda.

Sunting: Dalam hal segmentasi gambar, misalkan Anda memiliki topeng dengan kebenaran dasar, mari kita sebut topeng $A$ seperti yang Anda sarankan. Jadi topeng memiliki nilai 1 dalam piksel di mana ada sesuatu yang Anda coba temukan dan nol. Sekarang Anda memiliki algoritma untuk menghasilkan gambar / topeng $B$ , yang juga harus menjadi gambar biner, yaitu Anda membuat topeng untuk segmentasi Anda. Maka kita memiliki yang berikut:

Jumlah positif adalah jumlah total piksel yang memiliki intensitas 1 pada gambar $A$
Jumlah positif sejati adalah jumlah total pixel yang memiliki nilai 1 di kedua $A$ dan $B$ . Jadi persimpangan daerah yang di $A$ dan $B$ . Hal ini sama dengan menggunakan operator AND pada $A$ dan $B$ .
Jumlah positif palsu adalah jumlah piksel yang muncul sebagai 1 di $B$ tapi nol dalam $A$ .

Jika Anda melakukan ini untuk publikasi, maka tulislah Dadu dengan huruf besar D, karena ini dinamai setelah seorang pria bernama Dice.

EDIT: Mengenai komentar tentang koreksi: Saya tidak menggunakan rumus tradisional untuk menghitung koefisien Dice, tetapi jika saya menerjemahkannya ke notasi di jawaban lain itu menjadi:

Skor dadu = \frac{2 \cdot | SEBUAH \cap B |}{2 \cdot | SEBUAH \cap B | + | B ∖ SEBUAH | + | SEBUAH ∖ B |}

$\text{Dice score} = \frac{2\cdot|A\cap B|}{2\cdot|A\cap B| + |B\backslash A| + |A\backslash B|}$

Yang setara dengan definisi tradisional. Lebih mudah untuk menuliskannya dengan cara yang saya tulis semula untuk menyatakan rumus dalam hal positif palsu. Backslash adalah minus yang ditetapkan.

Gumeo
sumber

Terima kasih balasannya. Tepat untuk perbandingan segmentasi gambar. Jadi, skor dadu ini digunakan, katakanlah, beri gambar A dan gambar B. Gambar A adalah ground true (0 atau 1), dan gambar B adalah segmentasi saya. Jadi, berapakah jumlah total positif (1), apakah angka 1 dalam A + jumlah 1 dalam B ?? Saya agak bingung di sini. Sama dengan false positive

RockTheStar

@RockTheStar saya akan mengedit jawaban saya untuk akun segmentasi gambar.

Gumeo

Bagus, terima kasih banyak atas penjelasan Anda. Satu lagi pertanyaan lanjutan. Bagaimana dengan kisaran D? Apakah itu antara 0 dan 1?

RockTheStar

Terima kasih banyak! Akan mengimplementasikan ini dan lihat hasilnya

RockTheStar

@Gumeo Anda mungkin ingin memperbaiki atau setidaknya menjelaskan jawaban Anda, silakan lihat jawaban baru saya untuk detail

dvb

The koefisien Dice (juga dikenal sebagai indeks kesamaan Dice) adalah sama dengan skor F1 , tapi itu tidak sama dengan akurasi. Perbedaan utama mungkin adalah fakta bahwa akurasi memperhitungkan negatip benar negatif sedangkan koefisien Dice dan banyak tindakan lain hanya menangani negatip sebenarnya sebagai default yang tidak menarik (lihat Dasar-Dasar Evaluasi Klasifikasi, Bagian 1 ).

Sejauh yang saya tahu, koefisien Dice tidak dihitung seperti yang dijelaskan oleh jawaban sebelumnya , yang sebenarnya mengandung rumus untuk indeks Jaccard (juga dikenal sebagai "persimpangan atas persatuan" dalam visi komputer).

\begin{aligned} D saya c e (SEBUAH, B) & = \frac{2 | SEBUAH \cdot B |}{| SEBUAH | + | B |} \\ F 1 (SEBUAH, B) & = \frac{2}{| SEBUAH | / | SEBUAH \cdot B | + | B | / | SEBUAH \cdot B |} \\ J Sebuah c c Sebuah r d (SEBUAH, B) & = \frac{| SEBUAH \cdot B |}{| m Sebuah x (SEBUAH, B) |} = \frac{| SEBUAH \cdot B |}{| SEBUAH | + | B | - | SEBUAH \cdot B |} \\ SEBUAH c c kamu r Sebuah c y (SEBUAH, B) & = \frac{| SEBUAH \cdot B | + | \bar{SEBUAH} \cdot \bar{B} |}{| SEBUAH l l |} \end{aligned}

$\begin{align*} Dice(A,B) &= \frac{2|A\cdot B|}{ |A| + |B| } \\ F1(A,B) &= \frac{2}{|A|/|A \cdot B| + |B|/|A\cdot B|} \\ Jaccard(A,B) &= \frac{|A\cdot B|}{|max(A,B)|} = \frac{|A\cdot B|}{|A|+|B|-|A\cdot B|}\\ Accuracy(A,B) &= \frac{|A\cdot B|+|\overline{A} \cdot \overline{B}|}{|All|} \\ \end{align*}$

$A,B$ $All$ $|A \cdot B|$ $A$ $B$ $|\overline{A} \cdot \overline{B}|$ $A$ $B$

Koefisien Dice dan indeks Jaccard terkait secara monoton, dan indeks Tversky menggeneralisasikan keduanya, untuk membaca lebih lanjut tentang itu lihat kesamaan skor-F, Dice, dan Jaccard .

Koefisien Dice juga merupakan rata-rata harmonik dari Sensitivitas dan Presisi, untuk melihat mengapa itu masuk akal, baca Mengapa F-Measure merupakan rata-rata harmonik dan bukan rata-rata aritmatika dari pengukuran Precision and Recall? .

Untuk membaca lebih lanjut tentang banyak istilah dalam jawaban ini dan hubungannya, lihat Evaluasi pengklasifikasi biner .

dvb
sumber