Kurva Kaplan-Meier tampaknya mengatakan sebaliknya daripada regresi Cox

9

Di R, saya melakukan analisis data kelangsungan hidup pasien kanker.

Saya telah membaca hal-hal yang sangat membantu tentang analisis survival di CrossValidated dan tempat-tempat lain dan berpikir saya mengerti bagaimana menafsirkan hasil regresi Cox. Namun, satu hasil masih mengganggu saya ...

Saya membandingkan kelangsungan hidup dengan jenis kelamin. Kurva Kaplan-Meier jelas mendukung pasien wanita (saya telah memeriksa beberapa kali bahwa legenda yang saya tambahkan benar, pasien dengan survival maksimum, 4856 hari, memang seorang wanita): masukkan deskripsi gambar di sini

Dan regresi Cox kembali:

Call:
coxph(formula = survival ~ gender, data = Clinical)

  n= 348, number of events= 154 

              coef exp(coef) se(coef)      z Pr(>|z|)  
gendermale -0.3707    0.6903   0.1758 -2.109    0.035 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

           exp(coef) exp(-coef) lower .95 upper .95
gendermale    0.6903      1.449    0.4891    0.9742

Concordance= 0.555  (se = 0.019 )
Rsquare= 0.012   (max possible= 0.989 )
Likelihood ratio test= 4.23  on 1 df,   p=0.03982
Wald test            = 4.45  on 1 df,   p=0.03499
Score (logrank) test = 4.5  on 1 df,   p=0.03396

Jadi Rasio Bahaya (SDM) untuk pasien pria ( gendermale) adalah 0,6903. Cara saya menafsirkan bahwa (tanpa melihat kurva Kaplan-Meier) adalah: karena HR adalah <1, menjadi pasien jenis kelamin laki-laki adalah protektif. Atau lebih tepatnya, pasien wanita adalah 1 / 0,6903 = exp (-coef) = 1,449 lebih mungkin meninggal pada waktu tertentu daripada pria.

Tapi itu tidak seperti yang dikatakan kurva Kaplan-Meier! Apa yang salah dengan interpretasi saya?

francoiskroll
sumber
3
Dari kurva KM Anda, tampaknya asumsi PH regresi Cox tidak berlaku.
Deep North
Saya melihat. Saya belum melihat itu sebelumnya! Secara grafis, itu berarti kurva Kaplan-Meier saya harus paralel sehingga saya dapat menggunakan Cox dengan aman, bukan? Tampaknya kurang lebih baik sebelum ~ 2200 hari. Apakah boleh melihat hasil Cox untuk semua data sedikit sebelum persimpangan?
francoiskroll
4
loglogS^i(t)S^i(t)i
@DeepNorth: Saya tidak benar-benar melihat bukti kuat terhadap bahaya proporsional. Ya kurva secara teknis tumpang tindih ... tapi itu di ekor ekstrim.
Cliff AB
Untuk melengkapi jawaban dan komentar lainnya, bandingkan kelangsungan hidup rata-rata atau kelangsungan hidup lima tahun untuk pria dan wanita. Ada manfaat yang jelas untuk pria dalam data ini sesuai dengan analisis Cox PH.
Itamar

Jawaban:

12

Ini adalah contoh bahaya non-proporsional yang sangat baik ATAU efek 'penipisan' dalam analisis kelangsungan hidup. Saya akan coba jelaskan.

Pertama-tama perhatikan baik-baik kurva Kaplan-Meier (KM) Anda: Anda dapat melihat di bagian pertama (hingga sekitar 3000 hari) proporsi pria yang masih hidup dalam populasi berisiko pada waktu t lebih besar daripada proporsi wanita (yaitu garis biru 'lebih tinggi' dari yang merah). Ini berarti bahwa memang jenis kelamin laki-laki adalah 'pelindung' untuk acara (kematian) yang dipelajari. Karenanya, rasio bahaya harus antara 0 dan 1 (dan koefisiennya harus negatif).

Namun, setelah 3000 hari, garis merah lebih tinggi! Ini memang akan menyarankan sebaliknya. Berdasarkan grafik KM ini saja, ini selanjutnya akan menyarankan bahaya non-proporsional. Dalam hal ini 'non-proporsional' berarti bahwa pengaruh variabel independen Anda (gender) tidak konstan dari waktu ke waktu. Dengan kata lain, rasio bahaya layak untuk berubah seiring berjalannya waktu. Seperti yang dijelaskan di atas, inilah masalahnya. Model Cox hazard proporsional reguler tidak mengakomodasi efek seperti itu. Sebenarnya, salah satu asumsi utama adalah bahayanya proporsional! Sekarang Anda dapat memodelkan bahaya yang tidak proporsional juga, tetapi itu berada di luar cakupan jawaban ini.

Ada satu komentar tambahan untuk dibuat: perbedaan ini bisa jadi karena bahaya sebenarnya adalah tidak proporsional ataufakta bahwa ada banyak variasi dalam estimasi ekor kurva KM. Perhatikan bahwa pada saat ini total kelompok 348 pasien akan menurun ke populasi yang sangat kecil yang masih berisiko. Seperti yang Anda lihat, kedua kelompok gender memiliki pasien yang mengalami kejadian tersebut dan pasien disensor (garis vertikal). Ketika populasi berisiko menurun, perkiraan kelangsungan hidup akan menjadi kurang pasti. Jika Anda merencanakan interval kepercayaan 95% di sekitar garis KM, Anda akan melihat lebar interval kepercayaan meningkat. Ini penting untuk estimasi bahaya juga. Sederhananya, karena populasi berisiko dan jumlah peristiwa dalam periode akhir studi Anda rendah, periode ini akan berkontribusi lebih sedikit untuk perkiraan dalam model cox awal Anda.

Akhirnya, ini akan menjelaskan mengapa bahaya (diasumsikan konstan dari waktu ke waktu) lebih sesuai dengan bagian pertama KM Anda, bukan titik akhir akhir.

EDIT: lihat komentar langsung @ Scrotchi terhadap pertanyaan awal: Seperti yang dinyatakan, pengaruh angka rendah pada periode akhir penelitian adalah bahwa perkiraan bahaya pada titik-titik waktu tidak pasti. Akibatnya, Anda juga kurang yakin apakah pelanggaran nyata terhadap asumsi bahaya proporsional bukan karena kebetulan. Seperti yang dinyatakan @ scrotchi, asumsi PH mungkin tidak seburuk itu.

IWS
sumber
1
(-1) Ekor melintang di ujung yang ekstrem, di mana kita memiliki data yang sangat sedikit. Faktanya, bukti untuk "bahaya non-proporsional" didasarkan pada hanya dua pengamatan (yaitu ketika t> 2800, hanya ada dua subjek yang tersisa di kohort perempuan, dan selain itu, peristiwa terakhir sebelum dalam kelompok adalah sekitar t = 2100)
Cliff AB
2
@CliffAB Terima kasih atas umpan balik Cliff AB. Saya agak bingung, karena ucapan Anda persis seperti apa yang ingin saya katakan. Saya akui: itu mungkin sedikit lebih pendek. -1 agak sedikit keras: '(
IWS
2
mungkin itu agak jahat padaku. Satu-satunya poin saya adalah bahwa ketika saya melihat ini, saya tidak melihat contoh yang baik dari bahaya yang tidak proporsional, tetapi sedikit data tentang ekornya. Saya melihat kalimat pertama telah direvisi (saya pikir kecuali saya melewatkan ini pertama kali?) Untuk mengatasi, jadi sekarang (-1) pasti tidak pantas.
Cliff AB
1
Ups, sepertinya saya memang melewatkannya pertama kali. Maaf!
Cliff AB
Tidak masalah, setidaknya kami sepakat pada jawabannya: D
IWS
5

Anda bingung tentang sifat output Anda. Data ini mengatakan: Jika Anda seorang pria, Anda lebih mungkin hidup lebih lama daripada wanita; Perempuan memiliki kelangsungan hidup yang lebih buruk daripada laki-laki. Hal ini tercermin dalam hasil regresi karena efek dari menjadi MALE adalah memiliki rasio bahaya log negatif, misalnya pria memiliki risiko lebih rendah daripada wanita. Pada sebagian besar waktu kejadian (ketika kurva "melangkah"), kurva kelangsungan hidup pria lebih besar daripada kurva wanita, hasil model dan grafik Cox sangat sesuai. Kurva KM mengkonfirmasi hal ini seperti halnya keluaran model regresi. "Salib" adalah yang tidak penting.

Kurva KM berperilaku buruk di ekor, terutama ketika mereka mendekati 0% dan / atau lancip dengan rata. Sumbu Y adalah proporsi yang bertahan. Dengan relatif sedikit yang bertahan lama dalam penelitian ini, dan sedikit yang mati pada waktu itu, keandalan perkiraan tersebut secara intuitif dan grafik mengerikan. Saya perhatikan, misalnya, ada lebih sedikit perempuan dalam kelompok Anda daripada laki - laki dan setelah 2.800 hari, ada kurang dari 10 perempuan yang tersisa dalam kelompok, sebagaimana dibuktikan oleh langkah-langkah dalam kurva bertahan hidup dan kurangnya acara yang disensor.

Sebagai catatan yang menarik, karena analisis survival menggunakan kurva KM, tes peringkat log, dan model Cox menggunakan waktu survival peringkat , durasi sebenarnya survival agak tidak relevan. Wanita Anda yang bertahan lama bisa, infact, bertahan selama 100 tahun lagi dan itu tidak akan berdampak pada analisis. Ini karena fungsi garis dasar bahaya (tidak mengamati peristiwa selama 13 tahun terakhir) akan menganggap tidak ada risiko kematian bagi mereka yang 87 tahun ke depan karena tidak ada yang meninggal saat itu.

Jika Anda ingin HR yang kuat untuk mendapatkan 95% CI dan nilai-p yang benar untuk ini, tentukan robust=TRUEdalam Cox-PH untuk mendapatkan kesalahan standar sandwich. Dalam hal itu, HR adalah rata-rata HR yang membandingkan pria dengan wanita di semua waktu kegagalan.

AdamO
sumber
Untuk memperjelas: Dalam plot KM, pria memiliki ketahanan hidup yang lebih baik hingga sekitar 2.700 hari. Setelah itu, wanita memiliki kelangsungan hidup yang lebih baik. Tapi ekor itu tidak tepat karena ada sangat sedikit data di luar sana. Anda dapat melihat bahwa dua langkah dalam kurva KM mengambil kelangsungan hidup wanita dari sekitar 35% hingga 0%, sehingga kemungkinan besar adalah dua orang. Akan sangat membantu untuk merencanakan kurva KM dengan pita kepercayaan. Maka saya kira Anda akan melihat pemisahan yang jelas hingga sekitar 2000 hari, dan kemudian tumpang tindih setelah itu.
Harvey Motulsky
2
@ HarveyMotulsky benar tetapi ekor KM sangat tidak bisa diandalkan. Jika OP menarik CI mereka akan tumpang tindih dengan kuat, sehingga dapat disimpulkan bahwa kelangsungan hidup itu mungkin samar setelah 2.700 hari.
AdamO
Poin saya tepat. Data jelas menunjukkan bahwa laki-laki (dalam situasi ini, apa pun itu) memiliki kelangsungan hidup yang lebih baik setidaknya untuk 2000+ hari pertama.
Harvey Motulsky