Analisis survival untuk prediksi acara

9

Untuk setiap catatan dalam kumpulan data saya, saya memiliki informasi berikut

(X1 , ,Xm ,δ ,T )

di mana adalah fitur, δ adalah 1 jika acara target terjadi dan 0 sebaliknya, dan T adalah cap waktu acara yang terjadi. Secara khusus, T mungkin akan hilang jika tidak ada acara atau waktu yang ditentukan untuk tindak lanjutnya.XiδTT

Saya ingin menghitung indeks risiko untuk setiap catatan dalam dataset saya.

Saya berpikir untuk menggunakan model klasifikasi yang menggunakan fitur untuk memprediksi kelas δ . Namun, T penting: jika acara δ kemungkinan akan terjadi segera risikonya harus lebih tinggi.XiδTδ

Itu sebabnya analisis kelangsungan hidup harus sesuai untuk masalah ini. Saya tidak perlu estimasi penuh dari tetapi hanya satu indeks yang mewakili risiko untuk satu catatan.S(t)=P(T>t)

Waktu survival rata-rata, yang dapat dihitung untuk setiap catatan, tampaknya indeks risiko yang bagus - semakin rendah semakin tinggi risikonya.

Pertanyaan saya adalah:

  1. Apakah analisis kelangsungan hidup cocok untuk tujuan saya?
  2. Bagaimana saya bisa mengevaluasi kinerja model saya?

c

c

Xi(t)

Simone
sumber

Jawaban:

3

Apakah analisis kelangsungan hidup cocok untuk tujuan saya?

Satu-satunya hal yang membuat ini tampak kurang berlaku untuk analisis survival adalah:

TT

Anda perlu mengetahui periode terakhir yang diamati masih hidup untuk sebagian besar model. Kalau tidak, itu harus langsung dan berlaku untuk menggunakan analisis survival. Misalnya Cox proporsional hazard dengan survival::coxphR atau model parametrik dengan survival::survreg.

Waktu survival rata-rata, yang dapat dihitung untuk setiap catatan, tampaknya indeks risiko yang bagus - semakin rendah semakin tinggi risikonya.

Ya, Anda dapat menggunakan waktu survival rata-rata atau hanya prediktor linier untuk dua model (kelas) yang disebutkan sebelumnya.

Bagaimana saya bisa mengevaluasi kinerja model saya?

cHmisc::rcorr.cens

Benjamin Christoffersen
sumber