Saya mencoba memahami cara menghitung titik potong optimal untuk kurva ROC (nilai di mana sensitivitas dan spesifisitas dimaksimalkan). Saya menggunakan dataset aSAH
dari paket pROC
.
The outcome
variabel dapat dijelaskan oleh dua variabel independen: s100b
dan ndka
. Menggunakan sintaks Epi
paket, saya telah membuat dua model:
library(pROC)
library(Epi)
ROC(form=outcome~s100b, data=aSAH)
ROC(form=outcome~ndka, data=aSAH)
Output diilustrasikan dalam dua grafik berikut:
Dalam grafik pertama ( s100b
), fungsi mengatakan bahwa titik potong optimal dilokalkan pada nilai yang sesuai lr.eta=0.304
. Dalam grafik kedua ( ndka
) titik potong optimal dilokalkan pada nilai yang sesuai dengan lr.eta=0.335
(apa artinya lr.eta
). Pertanyaan pertama saya adalah:
- apa yang sesuai
s100b
danndka
nilai untuklr.eta
nilai yang ditunjukkan (apa titik potong optimal dalam hals100b
danndka
)?
PERTANYAAN KEDUA:
Sekarang anggaplah saya membuat model dengan mempertimbangkan kedua variabel:
ROC(form=outcome~ndka+s100b, data=aSAH)
Grafik yang diperoleh adalah:
Saya ingin tahu apa nilai-nilai ndka
AND s100b
di mana sensibilitas dan spesifisitas dimaksimalkan oleh fungsi. Dalam istilah lain: apa saja nilai ndka
dan s100b
di mana kita memiliki Se = 68,3% dan Sp = 76,4% (nilai yang diturunkan dari grafik)?
Saya kira pertanyaan kedua ini terkait dengan analisis multiROC, tetapi dokumentasi Epi
paket tidak menjelaskan bagaimana menghitung cutpoint optimal untuk kedua variabel yang digunakan dalam model.
Pertanyaan saya muncul sangat mirip dengan pertanyaan ini dari reasearchGate , yang mengatakan singkatnya:
Penentuan skor cut-off yang mewakili trade-off yang lebih baik antara sensitivitas dan spesifisitas ukuran sangat mudah. Namun, untuk analisis kurva ROC multivariat, saya telah mencatat bahwa sebagian besar peneliti telah berfokus pada algoritma untuk menentukan akurasi keseluruhan kombinasi linear dari beberapa indikator (variabel) dalam hal AUC. [...]
Namun, metode ini tidak menyebutkan cara memutuskan kombinasi skor cut-off yang terkait dengan berbagai indikator yang memberikan akurasi diagnostik terbaik.
Solusi yang mungkin adalah yang diusulkan oleh Shultz dalam makalahnya , tetapi dari artikel ini saya tidak dapat memahami bagaimana menghitung titik potong yang optimal untuk kurva ROC multivarian.
Mungkin solusi dari Epi
paket tidak ideal, jadi tautan bermanfaat lainnya akan dihargai.
lr.eta
ROC
Kalimat pertama Anda harus mengatakan (sebagaimana dibuktikan oleh grafik) bahwa Anda mencari di mana jumlah sensitivitas & spesifisitas dimaksimalkan. Tetapi mengapa ini "optimal"? Apakah hasil positif palsu memiliki impor yang sama dengan hasil negatif palsu? Lihat di sini .
sumber
coords
fungsi daripROC
paket, seperti yang saya temukan nanti. Titik potong optimal, dalam kasus saya, kombinasi terbaik dari Sens dan Spec; Saya membaca jawaban yang tertaut, tetapi saya tidak peduli (setidaknya untuk sekarang) tentang hasil positif palsu dan negatif palsu, karena (jika saya mengerti dengan baik) saya menganalisis sekelompok data yang dikumpulkan untuk penelitian.lr.eta
Anda dapat menemukan ambang di mana tingkat positif sejati (tpr) memotong tingkat negatif sejati (tnr) ini akan menjadi titik di mana jumlah positif palsu dan negatif palsu adalah minimum.
sumber