Apa perbedaan antara berbagai jenis residu dalam analisis survival (regresi Cox)?

9

Saya cukup baru dalam analisis survival. Saya disarankan untuk mencari dan mempelajari residu Schoenfeld sebagai bagian dari model diagnosis untuk melihat apakah asumsi bahaya proporsional telah dipenuhi. Sementara melihat ini, saya telah melihat referensi untuk berbagai jenis residu termasuk:

  • Cox-Snell
  • Penyimpangan
  • Martingale
  • Skor
  • Schoenfeld

Apa perbedaan antara residu ini dan kapan dianjurkan untuk menggunakan satu sama lain? (Saya senang dengan jawaban yang hanya berupa tautan ke makalah untuk dibaca.)

Gowerc
sumber

Jawaban:

14

Residu Cox-Snell , digunakan untuk menilai -of-fit model. Dengan memplot residu Cox-Snell terhadap fungsi bahaya kumulatif, kecocokan model dapat dinilai. Model yang pas akan menunjukkan garis linier melalui titik asal dengan gradien satuan. Perlu dicatat bahwa akan diperlukan model yang sangat tidak sesuai untuk residu Cox-Snell untuk menyimpang secara signifikan dari ini. Juga tidak jarang untuk melihat beberapa lompatan kecil yang terjadi pada ekstremitas grafik. Satu kritik terhadap residu Cox-Snell adalah bahwa mereka tidak memperhitungkan pengamatan yang disensor, oleh karena itu residu Cox-Snell yang disesuaikan dibuat oleh Crowley & Hu (1977) di mana residu Cox-Snell standar, dapat digunakan untuk uncensored pengamatan danrCirCirCi+Δdimana , digunakan untuk menyesuaikan sisa.Δ=log(2)=0.693

Residu Martingale dapat didefinisikan sebagai mana adalah sakelar yang mengambil nilai 0 jika observasi disensor dan 1 jika observasi tanpa sensor. Residu Martingale mengambil nilai antara untuk pengamatan tanpa sensor danrMirMi=δirCiδiii[1,][0,]untuk pengamatan yang disensor. Residu Martingale dapat digunakan untuk menilai bentuk fungsional sebenarnya dari kovariat tertentu (Thernau et al. (1990)). Seringkali berguna untuk menampilkan kurva LOESS di atas plot ini karena mereka dapat berisik dalam plot dengan banyak pengamatan. Residu Martingale juga dapat digunakan untuk menilai outlier dalam kumpulan data di mana fungsi survivor memprediksi suatu peristiwa terlalu dini atau terlalu terlambat, namun, sering kali lebih baik menggunakan residu penyimpangan untuk ini.

Sisa penyimpangan, manarDi=sgn(rMi)2rMi+δilog(δirMi)sgnmengambil nilai 1 untuk residu martingale positif dan -1 untuk residu martingale negatif. Sisa dari nilai absolut tinggi adalah indikasi pencilan. Sisa penyimpangan bernilai positif adalah indikasi dari pengamatan dimana peristiwa terjadi lebih cepat dari yang diperkirakan; yang sebaliknya berlaku untuk residual yang bernilai negatif. Tidak seperti residu Martingale, residu penyimpangan rata-rata berpusat di sekitar 0, membuatnya lebih mudah diinterpretasikan daripada residu Martingale ketika mencari outlier. Salah satu aplikasi residu penyimpangan adalah untuk jackknife dataset dengan hanya satu parameter model dan menguji perbedaan yang signifikan dalam koefisien parameter karena setiap pengamatan dihapus. Perubahan yang signifikan akan menunjukkan pengamatan yang sangat berpengaruh.

Residu Schoenfeld sedikit berbeda karena setiap residu sesuai dengan variabel, bukan observasi. Penggunaan residu Schoenfeld adalah untuk menguji asumsi bahaya proporsional. Grambsch dan Thernau (1994) mengusulkan bahwa sisa residu Schoenfeld mungkin lebih bermanfaat. Dengan memplot waktu kejadian terhadap residu Schoenfeld untuk setiap variabel, kepatuhan variabel terhadap asumsi PH dapat dinilai dengan memasang kurva LOESS ke plot. Garis lurus yang melewati nilai residu 0 dengan gradien 0 menunjukkan bahwa variabel memenuhi asumsi PH dan karenanya tidak tergantung pada waktu. Residu Schoenfeld juga dapat dinilai melalui uji hipotesis.

Tom Pinder
sumber
1. Residu Cox-Snell diplot sebagai: vs , atau: vs 2. Rumus residu penyimpangan membutuhkan sedikit penyesuaian: 3. Selain itu, lihat di sini . H^(rCi)rCilog[H^(rCi)]log[rCi]rDi=sgn(rMi)2[rMi+δilog(δirMi)]
Fliphoes