Regresi Cox dan skala waktu

9

Apakah variabel X (hazard) dalam analisis regresi hazard proporsional Cox selalu harus tepat waktu? Jika tidak, bisakah Anda memberikan contoh?

Bisakah usia pasien kanker menjadi variabel bahaya? Jika demikian, dapatkah itu ditafsirkan sebagai risiko terkena kanker pada usia tertentu? Akankah regresi Cox menjadi analisis yang sah untuk mempelajari hubungan antara ekspresi gen dan usia?

yuk
sumber

Jawaban:

8

Biasanya, usia pada awal digunakan sebagai kovariat (karena sering dikaitkan dengan penyakit / kematian), tetapi dapat digunakan sebagai skala waktu Anda juga (saya pikir itu digunakan dalam beberapa studi longitudinal, karena Anda perlu memiliki cukup orang yang berisiko sepanjang skala waktu, tetapi saya tidak ingat benar-benar - baru saja menemukan slide ini tentang Menganalisis studi kohort dengan asumsi skala waktu berkelanjutan yang berbicara tentang studi kohort). Dalam penafsiran, Anda harus mengganti waktu acara berdasarkan usia, dan Anda dapat memasukkan usia saat diagnosis sebagai kovariat. Ini masuk akal ketika Anda mempelajari mortalitas spesifik usia terhadap penyakit tertentu (seperti yang diilustrasikan dalam slide ini ).

Mungkin artikel ini menarik karena kontras dengan dua pendekatan, waktu-on-studi vs usia kronologis: Skala Waktu dalam Model Cox: Pengaruh Variabilitas Di Antara Usia Masuk pada Estimasi Koefisien . Ini kertas lain:

Cheung, YB, Gao, F, dan Khoo, KS (2003). Usia saat diagnosis dan pilihan metode analisis kelangsungan hidup dalam epidemiologi kanker . Jurnal Epidemiologi Klinik , 56 (1), 38-43.

Tetapi tentu saja ada kertas yang lebih baik.

chl
sumber
@ Ya: Terima kasih banyak. Saya akan melihat surat-suratnya. Bisakah Anda mengomentari pertanyaan pertama? Apakah variabel bahaya selalu waktu?
yuk
@yuk Belum tentu, seperti yang disarankan oleh @whuber. Saya ada dalam pikiran aplikasi lain dari regresi Cox berurusan dengan pengobatan pola sistematis tanggapan yang hilang dalam pengujian pendidikan, seperti yang muncul ketika seorang siswa tidak memiliki cukup waktu untuk menyelesaikan tes (tanggapan yang hilang kemudian dapat dianggap sebagai sensor yang benar) - - dalam hal ini, ini adalah pemesanan barang yang dianggap sebagai skala waktu. Saya akan melihat makalah aslinya (meskipun saya pikir ini juga merupakan subjek PhD).
chl
+1. Ada surat-surat lainnya, tetapi saya tidak yakin mereka pasti lebih baik; Saya pikir Chalise melakukan pekerjaan yang cukup baik menyimpulkan situasi.
ars
7

Tidak, tidak selalu harus waktu. Banyak respons yang disensor dapat dimodelkan dengan teknik analisis survival. Dalam bukunya Nondetect and Data Analysis , Dennis Helsel menganjurkan penggunaan negatif dari konsentrasi sebagai pengganti waktu (untuk mengatasi nondetect, yang ketika dinegasikan menjadi nilai sensor kanan). Sebuah sinopsis tersedia di Web (format pdf) dan paket R, NADA , alat ini.

whuber
sumber
+1, terima kasih telah menunjukkan paket NADA. Saya perhatikan itu membuatnya lebih mudah untuk menangani data yang disensor kiri melalui paket survival - apakah disensor kiri skenario umum dengan data lingkungan?
ars
@whuber: Terima kasih atas komentarnya, paket NADA terlihat sangat menarik.
yuk
@Andy: Terima kasih atas tautannya. Saya pikir nilainya menjadi jawaban. Saya akan merasa sedih.
yuk
@Yuk, sesuai permintaan Anda, saya membuat komentar saya menjadi jawaban, dan @ terima kasih atas contoh Anda.
Andy W
@ars: Ya, sensor kiri adalah karakteristik data lingkungan (dan merupakan perhatian utama chemometrics secara umum). Ini masalah yang rumit dan menarik. Di antara alasannya adalah (1) batas sensor ditentukan oleh perkiraan statistik (melalui proses kalibrasi), (2) sensor dapat terjadi dalam berbagai cara - seperti batas deteksi, batas kuantifikasi, atau "batas pelaporan", ( 3) ambang batas sering bervariasi dalam menanggapi kovariat ("gangguan matriks") yang dapat sangat berkorelasi dengan nilai sensor asli, (4) data sering didistribusikan secara lognormal.
whuber
4

Pada masalah skala usia vs skala waktu, chl memiliki beberapa referensi yang baik dan menangkap hal-hal penting - khususnya, persyaratan bahwa kelompok yang berisiko mengandung subjek yang cukup dari segala usia seperti yang akan muncul dalam studi longitudinal.

Saya hanya akan mencatat bahwa belum ada konsensus umum mengenai hal ini, tetapi ada beberapa literatur yang menyarankan bahwa usia harus dipilih sebagai skala waktu dalam kasus-kasus tertentu. Secara khusus, jika Anda memiliki situasi di mana waktu tidak menumpuk dengan cara yang sama untuk semua subjek, misalnya karena terpapar beberapa bahan beracun, maka usia mungkin lebih tepat.

Di sisi lain, Anda dapat menangani contoh spesifik itu pada model Cox PH skala waktu dengan menggunakan usia sebagai waktu yang bervariasi kovariat - alih-alih kovariat tetap pada waktu mulai. Anda perlu memikirkan mekanisme di balik objek studi Anda untuk mengetahui skala waktu mana yang lebih tepat. Kadang-kadang ada baiknya mencocokkan kedua model dengan data yang ada untuk melihat apakah perbedaan muncul dan bagaimana mereka dapat dijelaskan sebelum merancang studi baru Anda.

Akhirnya, perbedaan yang jelas dalam menganalisis keduanya adalah bahwa pada skala usia, interpretasi kelangsungan hidup adalah sehubungan dengan skala absolut (usia), sedangkan pada skala waktu, itu relatif terhadap tanggal mulai / masuknya penelitian. .

ars
sumber
3

Sesuai permintaan OP, inilah aplikasi lain yang saya lihat analisis kelangsungan hidup yang digunakan dalam konteks spasial (meskipun jelas berbeda dari pengukuran zat lingkungan yang disebutkan oleh whuber) memodelkan jarak antara peristiwa di ruang angkasa. Inilah salah satu contoh dalam kriminologi dan di sini adalah satu di epidemiologi .

Alasan di balik menggunakan analisis survival untuk mengukur jarak antara peristiwa bukanlah per mengatakan masalah sensor (meskipun sensor pasti dapat terjadi dalam konteks spasial), itu lebih karena distribusi yang sama antara karakteristik waktu ke peristiwa dan jarak antara peristiwa karakteristik (yaitu keduanya memiliki jenis struktur kesalahan yang sama (seringnya peluruhan jarak) yang melanggar OLS sehingga solusi non-parametrik ideal untuk keduanya).


Karena praktik kutipan yang buruk, saya harus menghabiskan waktu untuk menemukan tautan / referensi yang benar ke tautan di atas.

Misalnya dalam kriminologi,

Kikuchi, George, Mamoru Amemiya, Tomonori Saito, Takahito Shimada & Yutaka Harada. 2010. Analisis Spatio-Temporal tentang viktimisasi berulang yang berulang di Jepang . Konferensi Pemetaan Kejahatan Nasional ke-8. Institut Ilmu Kejahatan Jill Dando. PDF saat ini tersedia di halaman web yang dirujuk.

Dalam epidemiologi,

Pembaca, Steven. 2000. Menggunakan analisis survival untuk mempelajari pola titik spasial dalam epidemiologi geografis. Ilmu Sosial & Kedokteran 50 (7-8): 985-1000.

Andy W
sumber