Saya menggunakan pendekatan bootstrap untuk validasi internal model multivariat yang dibangun dengan regresi logistik standar ATAU jaring elastis.
Prosedur yang saya gunakan adalah sebagai berikut:
1) membangun model menggunakan seluruh dataset, mendapatkan nilai prediksi, dan menghitung AUC (AUC_ap, jelas)
2) menghasilkan 100-500 sampel bootstrap yang berasal dari dataset asli
3) untuk setiap sampel bootstrap, ikuti prosedur yang sama seperti pada # 1, dan dapatkan nilai prediksi dan auc untuk i) sampel bootstrap saat ini, dan ii) dataset asli
4) menghitung perbedaan antara i) dan ii) (di # 3) untuk masing-masing sampel bootstrap 100-500, dan ambil rata-rata -> "optimisme"
5) menghitung optimisme-koreksi AUC: AUC_ap - optimisme
Pertanyaan saya adalah APA kurva ROC yang terbaik untuk disajikan dalam makalah? Misalnya, ROC yang diturunkan pada langkah # 1 adalah satu pilihan, tetapi jelas optimis. Atau, saya telah mencoba untuk menghasilkan "ROC rata-rata" menggunakan paket R ROCR, berdasarkan kurva ROC yang diperoleh pada langkah # 3 (ii). Namun, AUC untuk [rata-rata kurva ROC ini] saya tidak percaya setara dengan nilai yang diperoleh pada langkah # 5.
Masukan apa pun sangat dihargai! -M