Apa nilai " " yang diberikan dalam ringkasan model coxph di R

18

Berapa nilai diberikan dalam ringkasan model coxph dalam R? Sebagai contoh,R2

Rsquare= 0.186   (max possible= 0.991 )

Saya dengan bodohnya memasukkannya sebagai manuskrip sebagai nilai dan pengulas langsung mengatakan bahwa ia tidak mengetahui analog dari statistik dari regresi linier klasik yang sedang dikembangkan untuk model Cox dan jika ada, silakan berikan referensi. Bantuan apa pun akan luar biasa!R2R2

danielsbrewer
sumber
1
Dalam kebanyakan situasi di mana konsep diperluas melampaui regresi linier klasik, itu adalah korelasi kuadrat antara nilai-nilai yang diamati dan yang diprediksi di bawah model. Mungkinkah itu berlaku di sini? R2
Makro
2
Tidak itu tidak ada hubungannya dengan itu.
Frank Harrell

Jawaban:

15

Menggunakan getS3method("summary","coxph")Anda dapat melihat bagaimana itu dihitung.

Baris kode yang relevan adalah sebagai berikut:

logtest <- -2 * (cox$loglik[1] - cox$loglik[2])
rval$rsq <- c(rsq = 1 - exp(-logtest/cox$n), maxrsq = 1 - 
        exp(2 * cox$loglik[1]/cox$n))

Berikut cox$loglikadalah "vektor dengan panjang 2 yang berisi kemungkinan log dengan nilai awal dan dengan nilai akhir dari koefisien" (lihat ?coxph.object) dan cox$n"jumlah pengamatan yang digunakan dalam fit".

Roland
sumber
5
Jika saya tidak salah, itu pseudo R-kuadrat Cox & Snell. Untuk penjelasan & perbandingan berbagai pseudo R-kuadrat, lihat ats.ucla.edu/stat/mult_pkg/faq/general/psuedo_rsquareds.htm .
onestop
4

ncoxph

Ronghui Xu
sumber
4
Salah, Anda membaginya dengan jumlah pengamatan, tidak peduli seberapa aneh kedengarannya. Untuk pertanyaan awal, aneh bahwa peninjau tidak akan menyadari sesuatu yang sudah ada selama 20 tahun untuk model Cox.
Frank Harrell
Menambah pertukaran antara Ronghui Xu dan @ Frank Harrell, tidak hanya itu `` terdengar aneh '' dibagi dengan jumlah pengamatan, itu tidak berhasil. Untuk melihat ini, pertimbangkan beta tetap pada beberapa nilai sehingga, secara kasar, E (R2) = 0,5, dan distribusi kovariat yang sama, yaitu, semuanya sama, terlepas dari kenyataan bahwa Studi 1 memiliki dua kali tingkat sensor sebagai Studi 2 Meskipun kita harus memperkirakan jumlah populasi yang sama, estimasi R2 dalam Studi 1 kira-kira setengah dari Studi 2, terlepas dari ukuran sampel. Alih-alih 0,5 kita akan mendapatkan sekitar 0,25.
R2
Dalam menjawab komentar Frank, saya akan setuju bahwa ini tidak langsung dan bahwa pengamatan Frank tentang kemungkinan nol log adalah benar. Saya hanya pernah melihat jumlah ini sebagai perkiraan terhadap penduga yang konsisten dari jumlah populasi yang terdefinisi dengan baik berdasarkan perolehan informasi. Makalah yang dirujuk oleh Ronghui Xu melakukan simulasi. Ini menunjukkan dampak penyensoran, meskipun tidak ada, menjadi jauh lebih lemah ketika kita membaginya dengan jumlah kegagalan daripada jumlah total pengamatan.
1
R2