Bagaimana Anda menginterpretasikan kurva survival dari model hazard proporsional cox?
Dalam contoh mainan ini, anggaplah kita memiliki model hazard proporsional cox pada age
variabel dalam kidney
data, dan menghasilkan kurva survival.
library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()
Misalnya, pada waktu , pernyataan mana yang benar? atau keduanya salah?
Pernyataan 1: kita akan memiliki 20% subjek yang tersisa (misalnya, jika kita memiliki orang, pada hari ke , kita akan memiliki sekitar tersisa), 200 200
Pernyataan 2: Untuk satu orang, dia memiliki peluang untuk bertahan hidup pada hari ke- .200
Usaha saya: Saya tidak berpikir kedua pernyataan itu sama (perbaiki saya jika saya salah), karena kita tidak memiliki asumsi awal (waktu bertahan hidup untuk semua orang TIDAK menggambar dari satu distribusi secara mandiri). Ini mirip dengan regresi logistik dalam pertanyaan saya di sini , tingkat bahaya setiap orang tergantung pada untuk orang tersebut.
sumber
Jawaban:
Karena bahaya tergantung pada kovariat, demikian juga fungsi bertahan hidup. Model ini mengasumsikan bahwa fungsi bahaya dari seseorang dengan vektor kovariat adalah h ( t ; x ) = h 0 ( t ) e β ′ x . Oleh karena itu, bahaya kumulatif individu ini adalah mana kita dapat mendefinisikan sebagai bahaya kumulatif dasar. Fungsi bertahan hidup untuk individu dengan vektor kovariat pada gilirannyax
Diberikan estimasi dan dari koefisien regresi dan fungsi survival dasar, sebuah estimasi fungsi survival untuk individu dengan vektor kovariat diberikan oleh . S 0(t)x S (t;x)= S 0(t)e β ' xβ^ S^0(t) x S^(t;x)=S^0(t)eβ^′x
Hitunglah ini di R Anda menentukan nilai kovariat Anda dalam
newdata
argumen. Misalnya jika Anda ingin fungsi bertahan hidup untuk individu usia = 70, dalam R, lakukanJika Anda, seperti yang Anda lakukan, menghilangkanS0(t)eβ′x¯
newdata
argumen, nilai standarnya sama dengan nilai rata-rata kovariat dalam sampel (lihat?survfit.coxph
). Jadi yang ditampilkan dalam grafik Anda adalah perkiraan .sumber
survfit.coxph
lebih hati-hati, saya telah memperbaiki kesalahan dalam jawaban saya, lihat pembaruan.Dalam bentuknya yang paling murni, kurva Kaplan-Meier dalam contoh Anda tidak membuat pernyataan di atas.
Pernyataan pertama membuat proyeksi ke depan akan memiliki . Kurva survival dasar hanya menggambarkan masa lalu, sampel Anda. Ya, 20% dari sampel Anda bertahan pada hari ke-200. Apakah 20% akan bertahan dalam 200 hari ke depan? Belum tentu.
Untuk membuat pernyataan itu, Anda harus menambahkan lebih banyak asumsi, membuat model, dll. Model itu bahkan tidak harus bersifat statistik dalam arti seperti regresi logistik. Misalnya, bisa PDE dalam epidemiologi dll.
Pernyataan kedua Anda mungkin didasarkan pada semacam asumsi homogenitas: semua orang adalah sama.
sumber
sumber
Mengenai asumsi: Saya berpikir bahwa tes koefisien biasa dalam pengaturan regresi Cox mengasumsikan independensi, tergantung pada kovariat yang diamati? Bahkan estimasi Kaplan-Meier tampaknya membutuhkan kemandirian antara waktu bertahan hidup dan sensor ( referensi ). Tapi saya mungkin salah, jadi koreksi dipersilahkan.
sumber