Bagaimana cara menafsirkan kurva survival model bahaya Cox?

9

Bagaimana Anda menginterpretasikan kurva survival dari model hazard proporsional cox?

Dalam contoh mainan ini, anggaplah kita memiliki model hazard proporsional cox pada agevariabel dalam kidneydata, dan menghasilkan kurva survival.

library(survival)
fit <- coxph(Surv(time, status)~age, data=kidney)
plot(conf.int="none", survfit(fit))
grid()

masukkan deskripsi gambar di sini

Misalnya, pada waktu , pernyataan mana yang benar? atau keduanya salah?200

  • Pernyataan 1: kita akan memiliki 20% subjek yang tersisa (misalnya, jika kita memiliki orang, pada hari ke , kita akan memiliki sekitar tersisa), 200 2001000200200

  • Pernyataan 2: Untuk satu orang, dia memiliki peluang untuk bertahan hidup pada hari ke- .20020%200


Usaha saya: Saya tidak berpikir kedua pernyataan itu sama (perbaiki saya jika saya salah), karena kita tidak memiliki asumsi awal (waktu bertahan hidup untuk semua orang TIDAK menggambar dari satu distribusi secara mandiri). Ini mirip dengan regresi logistik dalam pertanyaan saya di sini , tingkat bahaya setiap orang tergantung pada untuk orang tersebut.βTx

Haitao Du
sumber
Perhatikan bahwa model Anda mengasumsikan independensi di antara waktu acara.
ocram
analisis survival dapat memiliki asumsi independensi
Aksakal
jadi sepertinya pertanyaannya adalah pada R coding daripada statistik murni. kita perlu mengetahui sintaks dan fitur fungsi tertentu yang digunakan dalam contoh. jika itu masalahnya, bukankah ini di luar topik dalam beberapa hal? jika tidak, Anda perlu menjelaskan apa yang terjadi pada mereka yang tidak menggunakan R
Aksakal

Jawaban:

5

Karena bahaya tergantung pada kovariat, demikian juga fungsi bertahan hidup. Model ini mengasumsikan bahwa fungsi bahaya dari seseorang dengan vektor kovariat adalah h ( t ; x ) = h 0 ( t ) e β x . Oleh karena itu, bahaya kumulatif individu ini adalah mana kita dapat mendefinisikan sebagai bahaya kumulatif dasar. Fungsi bertahan hidup untuk individu dengan vektor kovariat pada gilirannya x

h(t;x)=h0(t)eβx.
H 0 ( t ) = t 0 h 0 ( u ) d u x
H(t;x)=0th(u;x)du=0th0(u)eβxdu=H0(t)eβx,
H0(t)=0th0(u)dux S 0 ( t ) = e - H 0 ( t )
S(t;x)=eH(t;x)=eH0eβx=S0(t)eβx
mana kami mendefinisikan sebagai fungsi bertahan hidup dasar. S0(t)=eH0(t)

Diberikan estimasi dan dari koefisien regresi dan fungsi survival dasar, sebuah estimasi fungsi survival untuk individu dengan vektor kovariat diberikan oleh . S 0(t)x S (t;x)= S 0(t)e β ' xβ^S^0(t)xS^(t;x)=S^0(t)eβ^x

Hitunglah ini di R Anda menentukan nilai kovariat Anda dalam newdataargumen. Misalnya jika Anda ingin fungsi bertahan hidup untuk individu usia = 70, dalam R, lakukan

plot(survfit(fit, newdata=data.frame(age=70)))

Jika Anda, seperti yang Anda lakukan, menghilangkan newdataargumen, nilai standarnya sama dengan nilai rata-rata kovariat dalam sampel (lihat ?survfit.coxph). Jadi yang ditampilkan dalam grafik Anda adalah perkiraan . S0(t)eβx¯

Jarle Tufto
sumber
Saya setuju dengan kamu. Ini adalah jawaban yang ditulis dengan baik. Saya meminta maaf kepada OP atas kesalahan saya dan saya menghargai cara OP memperbaikinya.
Michael R. Chernick
@ hxd1101 Setelah membaca halaman bantuan survfit.coxphlebih hati-hati, saya telah memperbaiki kesalahan dalam jawaban saya, lihat pembaruan.
Jarle Tufto
2

Kita akan memiliki 20% subjek yang tersisa (mis., Jika kita memiliki 1000 orang, pada hari ke 200, kita akan memiliki 200 yang tersisa)? atau Untuk orang tertentu, ia memiliki 20% peluang untuk bertahan hidup pada hari ke-200?

Dalam bentuknya yang paling murni, kurva Kaplan-Meier dalam contoh Anda tidak membuat pernyataan di atas.

Pernyataan pertama membuat proyeksi ke depan akan memiliki . Kurva survival dasar hanya menggambarkan masa lalu, sampel Anda. Ya, 20% dari sampel Anda bertahan pada hari ke-200. Apakah 20% akan bertahan dalam 200 hari ke depan? Belum tentu.

Untuk membuat pernyataan itu, Anda harus menambahkan lebih banyak asumsi, membuat model, dll. Model itu bahkan tidak harus bersifat statistik dalam arti seperti regresi logistik. Misalnya, bisa PDE dalam epidemiologi dll.

Pernyataan kedua Anda mungkin didasarkan pada semacam asumsi homogenitas: semua orang adalah sama.

Aksakal
sumber
xβTx
@ hxd1011, itu tergantung pada model Anda. Jika Anda memodelkan bagian-bagian mobil maka Anda bisa berasumsi mereka sama. di sisi lain kegagalan mereka dapat dikorelasikan dengan nomor batch, maka mereka tidak sama dll.
Aksakal
Saya mengedit pertanyaan saya untuk lebih spesifik pada model cox, apakah jawaban Anda tentang kurva Kaplan_Meier masih berlaku?
Haitao Du
2

S0(t)S(t)

S0(t)S(t)x=0

Haitao Du
sumber
0

S(t)=0.2t

t1h(t)h(t)

Mengenai asumsi: Saya berpikir bahwa tes koefisien biasa dalam pengaturan regresi Cox mengasumsikan independensi, tergantung pada kovariat yang diamati? Bahkan estimasi Kaplan-Meier tampaknya membutuhkan kemandirian antara waktu bertahan hidup dan sensor ( referensi ). Tapi saya mungkin salah, jadi koreksi dipersilahkan.

anak muda
sumber