Saya menggunakan 2 jenis regresi logistik - satu adalah tipe sederhana, untuk klasifikasi biner, dan yang lainnya adalah regresi logistik ordinal. Untuk menghitung akurasi yang pertama, saya menggunakan validasi silang, di mana saya menghitung AUC untuk setiap lipatan dan kemudian menghitung rata-rata AUC. Bagaimana saya bisa melakukannya untuk regresi logistik ordinal? Saya telah mendengar tentang ROC umum untuk prediktor multi-kelas, tetapi saya tidak yakin bagaimana cara menghitungnya.
Terima kasih!
logistic
cross-validation
roc
auc
ordered-logit
Noam Peled
sumber
sumber
Jawaban:
Saya hanya suka area di bawah kurva ROC ( -index) karena kebetulan probabilitas konkordansi. adalah blok bangunan koefisien korelasi peringkat. Sebagai contoh, Somers . Untuk ordinal , adalah ukuran yang sangat baik dari diskriminasi prediktif, dan paket R menyediakan cara mudah untuk mendapatkan estimasi bootstrap overfitting-koreksi . Anda dapat melakukan backsolve untuk -index umum (generalisasi AUROC). Ada alasan untuk tidak mempertimbangkan setiap tingkat secara terpisah karena ini tidak mengeksploitasi sifat ordinal dari .c D x y = 2 × ( c - 1c c YDxyDxycYYDx y= 2 × ( c - 12) Y Dx y Dx y c Y Y
rms
DalamY
rms
ada dua fungsi untuk regresi ordinal:lrm
danorm
, yang terakhir menangani terus menerus dan menyediakan lebih banyak keluarga distribusi (fungsi tautan) daripada peluang proporsional.sumber
orm
AUC untuk regresi ordinal adalah sesuatu yang rumit. Anda mungkin ingin menghitung AUC untuk setiap kelas dengan membuat boneka untuk mengambil nilai 1 untuk kelas yang Anda hitung AUC dan 0 untuk sisa kelas lainnya. Jika Anda memiliki 4 kelas maka Anda akan membuat 4 AUC dan plot mereka pada grafik yang sama. Masalah utama dengan metode ini adalah kenyataan bahwa metode ini menghukum kesalahan klasifikasi dengan setara. Jauh lebih intuitif mengklasifikasikan kelas 1 ke kelas 3 harus menjadi yang terburuk dari kesalahan klasifikasi kelas 1 ke kelas 2.
sumber