Titik potong dalam kurva ROC. Apakah ada fungsi sederhana?

10

Saya ingin mencari titik batas untuk gender berdasarkan pengukuran antropologis. Saya dapat menggambar kurva dan saya tahu bahwa dalam hal sensitivitas dan spesifisitas keduanya sama pentingnya, titik paling dekat dengan sudut kiri atas bingkai (atau jika kurva negatif, titik terdekat ke sudut kanan bawah) harus ditentukan sebagai cut-off.

Namun, saya tidak tahu apakah ada fungsi yang sudah diimplementasikan dalam R atau program lain untuk menentukan ini, cukup? Saya hanya tahu SPSS tidak memiliki fungsi seperti itu. Apakah Anda tahu ada program, atau R yang bisa melakukannya melalui fungsi yang sudah diterapkan?

Vic
sumber
3
Hai @Vic. Ada Rpaket luar biasa yang disebut ROCRuntuk perhitungan semacam ini. Temukan di sini . Lihat juga situs terkait dengan dokumentasi yang komprehensif. Ada juga makalah tentang paket tersebut .
COOLSerdash

Jawaban:

12

Anda ingin menghitung Indeks Youden , dan menemukan yang tertinggi di kurva ROC Anda.

Silahkan lihat di OptimalCutpoints dan cutpointr paket untuk R. Jika Anda melakukan analisis ROC, Anda juga dapat menggunakan coordsfungsi proc (sedikit self-iklan di sini):

library(pROC)
data(aSAH)
rocobj <- roc(aSAH$outcome, aSAH$s100b)
coords(rocobj, "best")
coords(rocobj, x="best", input="threshold", best.method="youden") # Same than last line
Calimo
sumber
4

Seperti @COOLSerdash menyebutkan ada paket R ROCR yang baik untuk melakukan analisis semacam ini.

Tetapi jawaban saya adalah bahwa tidak mungkin untuk membuat keputusan cut-off hanya berdasarkan pada beberapa metrik informasi.

Anda harus menentukan fungsi kerugian sebenarnya yang parameternya didasarkan pada beberapa nilai relatif dari berbagai kesalahan klasifikasi. Maka mudah untuk memilih titik cut-off yang memaksimalkan keuntungan atau meminimalkan kerugian.

Analis
sumber
1
Kata baik. Anda juga harus bertanya pada diri sendiri berapa nilai cutoff ketika Anda bisa menggunakan risiko yang diprediksi pada sebuah kontinum.
Frank Harrell
1
Vic menulis bahwa "sensitivitas dan spesifisitas sama-sama penting", yang saya tafsirkan sebagai biaya kesalahan klasifikasi yang berbeda adalah identik. Dalam hal ini fungsi biaya sederhana seperti Youden Index sesuai (tetapi sebenarnya tidak demikian halnya).
Calimo