Analisis survival dalam R dengan data terpotong kiri

8

Saya melakukan analisis survival dalam R dengan survivalpaket. Saya pikir saya bekerja dengan data terpotong kiri, tapi saya tidak sepenuhnya yakin bagaimana menanganinya.

Saya memiliki kohort pasien yang didiagnosis antara 1990 dan 2012. Semua pasien memiliki waktu diagnosis yang jelas (waktu masuk). Namun, hasil yang menarik (penyakit spesifik yang memburuk) baru didokumentasikan sejak tahun 2000 dan seterusnya. Untuk pasien yang didiagnosis sebelum tahun 2000, oleh karena itu tidak diketahui apakah hasilnya telah terjadi sebelum waktu itu - hanya setelah.

Pikiran pertama saya adalah bahwa saya perlu membatasi analisis untuk periode waktu dari tahun 2000, hanya termasuk pasien yang didiagnosis setelah titik waktu tersebut. Setelah melakukan beberapa pembacaan, tampaknya tidak perlu untuk mengecualikan pasien yang didiagnosis sebelum tahun 2000. Ini tampaknya pemotongan kiri dan yang dapat ditangani dalam coxphmenggunakan Surv(time1, time2, event), di mana waktu1 adalah waktu pemotongan-kiri (waktu dari diagnosis hingga awal dokumentasi dari hasil) dan waktu 2 adalah waktu-ke-peristiwa (dari saat diagnosis).

Berikut adalah dua contoh pasien dalam dataset saya:

Pasien # 1: Didiagnosis pada tahun 1999. Hasil diamati pada tahun 2001. Waktu pemotongan kiri: 1 tahun (hingga 2000). Waktu-ke-acara: 2 tahun.

Pasien # 2: Didiagnosis pada tahun 2001. Hasil diamati pada tahun 2005. Waktu pemotongan kiri: 0 tahun. Waktu-ke-acara: 4 tahun.

Untuk pasien-pasien ini, saya kira waktu kelangsungan hidup mereka (dalam tahun) pada objek bertahan hidup adalah (masing-masing):

Surv(time1 = c(1,0), time2 = c(2,4), event = c(1,1))

Apakah ini contoh data yang terpotong kiri? Jika demikian, apakah ini cara yang benar untuk menanganinya?

pengguna3766836
sumber

Jawaban:

3

Saya berasumsi bahwa waktu dari diagnosis adalah variabel waktu yang mendasarinya. Untuk kesederhanaan saya juga berasumsi bahwa acara tersebut hanya dapat terjadi sekali.

Anda dapat memperlakukan data sebagai sensor kiri. Namun ini berbeda dengan terpotong-kiri.

Untuk data terpotong kiri kami hanya memasukkan dalam studi pasien bersyarat pada mereka tidak mengalami peristiwa pada saat inklusi. Ini dalam jumlah kasus Anda akan membuang pasien yang telah memiliki acara sebelum tahun 2000. Dengan demikian, kami memodelkan survival yang bertahan pada survival sampai inklusi.

Ini berbeda dengan sensor kiri. Sensor kiri terjadi ketika kita hanya tahu batas atas waktu suatu peristiwa. Ini persis seperti yang Anda sarankan pada diri sendiri, jika saya mengerti Anda dengan benar. Dalam hal ini, kami menyertakan semua individu terlepas dari waktu bertahan hidup mereka, tetapi untuk beberapa individu kami hanya tahu batas atas waktu bertahan hidup mereka.

Bab III Model Statistik Berdasarkan Proses Penghitungan oleh PK Andersen et al. memberikan penjelasan yang baik tentang hal di atas bersama dengan beberapa contoh dari kedua kasus.

swmo
sumber
2

Anda cenderung bertabrakan dengan bias waktu abadi , yang berarti bahwa kohort yang didiagnosis sebelum tahun 2000 secara efektif abadi, sampai pasca-2000 ketika hasilnya dapat terjadi. Per Rothman dan Greenland, pendekatan yang benar memang untuk mengecualikan (memotong) pengamatan pra-2000 tahun dari analisis, atau bias risiko antara estimasi kohort menuju hipotesis nol tidak ada perbedaan dalam bahaya.

The survivalperintah Survtampaknya tidak mengikuti sintaks yang Anda gunakan. Bagaimana dengan membuat variabel baru di mana nilai 0 sesuai dengan Permulaan (Studi) Waktu (misalnya tahun = 2000?), 1 sesuai dengan 1 unit waktu, dll?

Anda akan ingin membaca di: Rothman, KJ dan Greenland, S. (1998). Epidemiologi Modern , bab Kohort Studies — Immortal Person Time. Lippincott-Raven, edisi ke-2.

Alexis
sumber
Saya melihat bias waktu abadi adalah penting, misalnya, dalam uji coba obat di mana pasien yang menerima obat dijamin untuk hidup selama waktu tertentu dengan desain studi sedangkan kelompok kontrol tidak, menghasilkan efek positif (palsu) yang diamati dari obat. Namun, dalam kasus saya, hilangnya data hasil adalah sama untuk semua pasien, terlepas dari pajanan. Menghilangkan semua pasien yang didiagnosis sebelum tahun 2000, akan mengakibatkan kurangnya kekuatan statistik, karena banyak dari mereka akan mengalami hasilnya setelah tahun 2000. Saya pikir harus ada cara untuk mengendalikan kemungkinan bias tanpa menghilangkan pasien ini.
user3766836
Ah saya mengerti, itu tidak jelas. Di sisi lain: mungkin data Anda tidak mendukung analisis yang ingin Anda lakukan.
Alexis