Diberikan nilai positif positif, negatif palsu, dapatkah Anda menghitung false positive, true negative?

24

Saya memiliki nilai untuk True Positive (TP)dan False Negative (FN)sebagai berikut:

TP = 0.25
FN = 0.75

Dari nilai-nilai itu, dapatkah kita menghitung False Positive (FP)dan True Negative (TN)?

Kesederhanaan
sumber

Jawaban:

53

Ada sedikit kebingungan terminologis di bidang ini. Secara pribadi, saya selalu merasa berguna untuk kembali ke matriks kebingungan untuk memikirkan hal ini. Dalam tes klasifikasi / skrining, Anda dapat memiliki empat situasi berbeda:

                      Condition: A        Not A

  Test says “A”       True positive   |   False positive
                      ----------------------------------
  Test says “Not A”   False negative  |    True negative

Dalam tabel ini, "benar positif", "salah negatif", "salah positif" dan "benar negatif" adalah peristiwa (atau probabilitasnya). Oleh karena itu apa yang Anda miliki mungkin merupakan tingkat positif benar dan tingkat negatif palsu . Perbedaan itu penting karena menekankan bahwa kedua angka memiliki pembilang dan penyebut.

Di mana hal-hal menjadi sedikit membingungkan adalah bahwa Anda dapat menemukan beberapa definisi "tingkat positif palsu" dan "tingkat negatif palsu", dengan penyebut yang berbeda.

Sebagai contoh, Wikipedia memberikan definisi berikut (mereka tampaknya cukup standar):

  • Tingkat positif sejati (atau sensitivitas):TPR=TP/(TP+FN)
  • Tingkat positif salah:FPR=FP/(FP+TN)
  • Tingkat negatif sejati (atau spesifisitas):TNR=TN/(FP+TN)

Dalam semua kasus, penyebutnya adalah total kolom . Ini juga memberi isyarat untuk interpretasi mereka: Tingkat positif sejati adalah probabilitas bahwa tes mengatakan "A" ketika nilai sebenarnya memang A (yaitu, itu adalah probabilitas bersyarat, dikondisikan pada A menjadi benar). Ini tidak memberi tahu Anda seberapa besar kemungkinan Anda benar ketika memanggil "A" (yaitu, probabilitas positif sejati, dikondisikan pada hasil tes menjadi "A").

Dengan asumsi tingkat negatif palsu didefinisikan dengan cara yang sama, kami kemudian memiliki (perhatikan bahwa angka Anda konsisten dengan ini). Namun kami tidak dapat secara langsung mendapatkan tingkat positif palsu baik dari tingkat positif benar atau negatif palsu karena mereka tidak memberikan informasi tentang spesifisitas, yaitu, bagaimana tes berperilaku ketika "bukan A" adalah jawaban yang benar. Karena itu, jawaban atas pertanyaan Anda adalah “tidak, tidak mungkin” karena Anda tidak memiliki informasi di kolom kanan dari matriks kebingungan.FNR=1-TPR

Namun ada definisi lain dalam literatur. Misalnya, Fleiss ( Metode statistik untuk tarif dan proporsi ) menawarkan yang berikut:

  • "[...] angka positif palsu [...] adalah proporsi orang, di antara mereka yang menjawab positif yang sebenarnya bebas dari penyakit."
  • "Tingkat negatif palsu [...] adalah proporsi orang, di antara mereka yang menanggapi negatif pada tes, yang memiliki penyakit."

(Dia juga mengakui definisi sebelumnya tetapi menganggapnya "boros terminologi yang berharga", justru karena mereka memiliki hubungan langsung dengan sensitivitas dan spesifisitas.)

Mengacu pada matriks kebingungan, itu berarti bahwa dan sehingga penyebutnya adalah total baris . Yang penting, di bawah definisi ini, tingkat positif palsu dan negatif palsu tidak dapat secara langsung berasal dari sensitivitas dan spesifisitas tes. Anda juga perlu mengetahui prevalensi (yaitu, seberapa sering A dalam populasi yang diminati).F N R = F N / ( T N + F N )FPR=FP/(TP+FP)FNR=FN/(TN+FN)

Fleiss tidak menggunakan atau mendefinisikan frasa “tingkat negatif sejati” atau “tingkat positif sejati” tetapi jika kita menganggap itu juga probabilitas bersyarat yang diberikan hasil / klasifikasi tes tertentu, maka jawaban @ guill11aume adalah yang benar.

Bagaimanapun, Anda perlu berhati-hati dengan definisi karena tidak ada jawaban yang tak terbantahkan untuk pertanyaan Anda.

Gala
sumber
4
Sangat bagus (+1). Saya langsung menggunakan satu interpretasi, tetapi Anda benar bahwa definisi alternatifnya standar.
gui11aume
1
@ gui11aume. Terima kasih! Itu adalah perasaan saya tetapi memikirkannya, saya tidak begitu yakin lagi. Melihat referensi, mungkin tergantung pada lapangan (pembelajaran mesin vs pengujian medis).
Gala
Pengalaman saya adalah bahwa definisi yang terakhir, TPR = TP / (TP + FP), FPR = FP / (TP + FP) lebih standar.
travelingbones
1
Berikut publikasi perbedaan: link.springer.com/article/10.1007/s10899-006-9025-5#enumeration Perhatikan terminologi baru "Uji FPR" vs. "Prediktif FPR"
travelingbones
8

EDIT: lihat jawaban dari Gaël Laurans, yang lebih akurat.

Jika tingkat positif sejati Anda adalah 0,25 itu berarti bahwa setiap kali Anda memanggil positif, Anda memiliki kemungkinan 0,75 salah. Ini adalah tingkat positif salah Anda. Demikian pula, setiap kali Anda memanggil negatif, Anda memiliki kemungkinan 0,25 benar, yang merupakan tingkat negatif Anda yang sebenarnya.

gui11aume
sumber
Bergantung pada apa yang coba dicirikan oleh seseorang: tes dalam pengaturan mengetahui kebenaran sebelumnya, atau mencoba untuk memutuskan probabilitas post-test hanya memberikan hasil di tangan.
kd4ttc
3

Tidak ada jika ini masuk akal jika "positif" dan "negatif" tidak masuk akal untuk masalah yang dihadapi. Saya melihat banyak masalah di mana "positif" dan "negatif" adalah pilihan paksa sewenang-wenang pada variabel ordinal atau kontinu. FP, TP, sens, spec hanya berguna untuk fenomena all-or-nothing.

Frank Harrell
sumber