Di R, saya melakukan analisis data kelangsungan hidup pasien kanker.
Saya telah membaca hal-hal yang sangat membantu tentang analisis survival di CrossValidated dan tempat-tempat lain dan berpikir saya mengerti bagaimana menafsirkan hasil regresi Cox. Namun, satu hasil masih mengganggu saya ...
Saya membandingkan kelangsungan hidup dengan jenis kelamin. Kurva Kaplan-Meier jelas mendukung pasien wanita (saya telah memeriksa beberapa kali bahwa legenda yang saya tambahkan benar, pasien dengan survival maksimum, 4856 hari, memang seorang wanita):
Dan regresi Cox kembali:
Call:
coxph(formula = survival ~ gender, data = Clinical)
n= 348, number of events= 154
coef exp(coef) se(coef) z Pr(>|z|)
gendermale -0.3707 0.6903 0.1758 -2.109 0.035 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
exp(coef) exp(-coef) lower .95 upper .95
gendermale 0.6903 1.449 0.4891 0.9742
Concordance= 0.555 (se = 0.019 )
Rsquare= 0.012 (max possible= 0.989 )
Likelihood ratio test= 4.23 on 1 df, p=0.03982
Wald test = 4.45 on 1 df, p=0.03499
Score (logrank) test = 4.5 on 1 df, p=0.03396
Jadi Rasio Bahaya (SDM) untuk pasien pria ( gendermale
) adalah 0,6903. Cara saya menafsirkan bahwa (tanpa melihat kurva Kaplan-Meier) adalah: karena HR adalah <1, menjadi pasien jenis kelamin laki-laki adalah protektif. Atau lebih tepatnya, pasien wanita adalah 1 / 0,6903 = exp (-coef) = 1,449 lebih mungkin meninggal pada waktu tertentu daripada pria.
Tapi itu tidak seperti yang dikatakan kurva Kaplan-Meier! Apa yang salah dengan interpretasi saya?
sumber
Jawaban:
Ini adalah contoh bahaya non-proporsional yang sangat baik ATAU efek 'penipisan' dalam analisis kelangsungan hidup. Saya akan coba jelaskan.
Pertama-tama perhatikan baik-baik kurva Kaplan-Meier (KM) Anda: Anda dapat melihat di bagian pertama (hingga sekitar 3000 hari) proporsi pria yang masih hidup dalam populasi berisiko pada waktu t lebih besar daripada proporsi wanita (yaitu garis biru 'lebih tinggi' dari yang merah). Ini berarti bahwa memang jenis kelamin laki-laki adalah 'pelindung' untuk acara (kematian) yang dipelajari. Karenanya, rasio bahaya harus antara 0 dan 1 (dan koefisiennya harus negatif).
Namun, setelah 3000 hari, garis merah lebih tinggi! Ini memang akan menyarankan sebaliknya. Berdasarkan grafik KM ini saja, ini selanjutnya akan menyarankan bahaya non-proporsional. Dalam hal ini 'non-proporsional' berarti bahwa pengaruh variabel independen Anda (gender) tidak konstan dari waktu ke waktu. Dengan kata lain, rasio bahaya layak untuk berubah seiring berjalannya waktu. Seperti yang dijelaskan di atas, inilah masalahnya. Model Cox hazard proporsional reguler tidak mengakomodasi efek seperti itu. Sebenarnya, salah satu asumsi utama adalah bahayanya proporsional! Sekarang Anda dapat memodelkan bahaya yang tidak proporsional juga, tetapi itu berada di luar cakupan jawaban ini.
Ada satu komentar tambahan untuk dibuat: perbedaan ini bisa jadi karena bahaya sebenarnya adalah tidak proporsional ataufakta bahwa ada banyak variasi dalam estimasi ekor kurva KM. Perhatikan bahwa pada saat ini total kelompok 348 pasien akan menurun ke populasi yang sangat kecil yang masih berisiko. Seperti yang Anda lihat, kedua kelompok gender memiliki pasien yang mengalami kejadian tersebut dan pasien disensor (garis vertikal). Ketika populasi berisiko menurun, perkiraan kelangsungan hidup akan menjadi kurang pasti. Jika Anda merencanakan interval kepercayaan 95% di sekitar garis KM, Anda akan melihat lebar interval kepercayaan meningkat. Ini penting untuk estimasi bahaya juga. Sederhananya, karena populasi berisiko dan jumlah peristiwa dalam periode akhir studi Anda rendah, periode ini akan berkontribusi lebih sedikit untuk perkiraan dalam model cox awal Anda.
Akhirnya, ini akan menjelaskan mengapa bahaya (diasumsikan konstan dari waktu ke waktu) lebih sesuai dengan bagian pertama KM Anda, bukan titik akhir akhir.
EDIT: lihat komentar langsung @ Scrotchi terhadap pertanyaan awal: Seperti yang dinyatakan, pengaruh angka rendah pada periode akhir penelitian adalah bahwa perkiraan bahaya pada titik-titik waktu tidak pasti. Akibatnya, Anda juga kurang yakin apakah pelanggaran nyata terhadap asumsi bahaya proporsional bukan karena kebetulan. Seperti yang dinyatakan @ scrotchi, asumsi PH mungkin tidak seburuk itu.
sumber
Anda bingung tentang sifat output Anda. Data ini mengatakan: Jika Anda seorang pria, Anda lebih mungkin hidup lebih lama daripada wanita; Perempuan memiliki kelangsungan hidup yang lebih buruk daripada laki-laki. Hal ini tercermin dalam hasil regresi karena efek dari menjadi MALE adalah memiliki rasio bahaya log negatif, misalnya pria memiliki risiko lebih rendah daripada wanita. Pada sebagian besar waktu kejadian (ketika kurva "melangkah"), kurva kelangsungan hidup pria lebih besar daripada kurva wanita, hasil model dan grafik Cox sangat sesuai. Kurva KM mengkonfirmasi hal ini seperti halnya keluaran model regresi. "Salib" adalah yang tidak penting.
Kurva KM berperilaku buruk di ekor, terutama ketika mereka mendekati 0% dan / atau lancip dengan rata. Sumbu Y adalah proporsi yang bertahan. Dengan relatif sedikit yang bertahan lama dalam penelitian ini, dan sedikit yang mati pada waktu itu, keandalan perkiraan tersebut secara intuitif dan grafik mengerikan. Saya perhatikan, misalnya, ada lebih sedikit perempuan dalam kelompok Anda daripada laki - laki dan setelah 2.800 hari, ada kurang dari 10 perempuan yang tersisa dalam kelompok, sebagaimana dibuktikan oleh langkah-langkah dalam kurva bertahan hidup dan kurangnya acara yang disensor.
Sebagai catatan yang menarik, karena analisis survival menggunakan kurva KM, tes peringkat log, dan model Cox menggunakan waktu survival peringkat , durasi sebenarnya survival agak tidak relevan. Wanita Anda yang bertahan lama bisa, infact, bertahan selama 100 tahun lagi dan itu tidak akan berdampak pada analisis. Ini karena fungsi garis dasar bahaya (tidak mengamati peristiwa selama 13 tahun terakhir) akan menganggap tidak ada risiko kematian bagi mereka yang 87 tahun ke depan karena tidak ada yang meninggal saat itu.
Jika Anda ingin HR yang kuat untuk mendapatkan 95% CI dan nilai-p yang benar untuk ini, tentukan
robust=TRUE
dalam Cox-PH untuk mendapatkan kesalahan standar sandwich. Dalam hal itu, HR adalah rata-rata HR yang membandingkan pria dengan wanita di semua waktu kegagalan.sumber