Penjelasan awam tentang sensor dalam analisis kelangsungan hidup

13

Saya telah membaca tentang apa itu sensor dan bagaimana hal itu perlu diperhitungkan dalam analisis kelangsungan hidup tetapi saya ingin mendengar definisi yang kurang matematis tentang itu dan definisi yang lebih intuitif (gambar akan lebih bagus!). Adakah yang bisa memberi saya penjelasan tentang 1) penyensoran dan 2) bagaimana pengaruhnya terhadap hal-hal seperti kurva Kaplan-Meier dan regresi Cox?

Ahli Statistik Rusty
sumber
Saya sarankan mendengarkan podcast Linear Digression pada analisis survival dan mendengar definisi penyederhanaan mereka tentang sensor kiri dan kanan dan motivasi untuk model cox.
Uri Goren

Jawaban:

16

Penyensoran sering dijelaskan dalam perbandingan dengan pemotongan . Deskripsi yang bagus dari kedua proses ini disediakan oleh Gelman et al (2005, p. 235):

Data terpotong berbeda dari data yang disensor bahwa tidak ada jumlah pengamatan di luar titik pemotongan yang tersedia. Dengan menyensor nilai - nilai pengamatan di luar titik pemotongan hilang, tetapi jumlahnya diamati.

Sensor atau pemotongan dapat terjadi untuk nilai di atas beberapa level (sensor kanan), di bawah beberapa level (sensor kiri), atau keduanya.

2.02.0

masukkan deskripsi gambar di sini

Contoh intuitif sensor adalah bahwa Anda bertanya kepada responden tentang usia mereka, tetapi catat hanya sampai beberapa nilai dan semua usia di atas nilai ini, katakanlah 60 tahun, dicatat sebagai "60+". Ini mengarah pada memiliki informasi yang akurat untuk nilai-nilai yang tidak disensor dan tidak ada informasi tentang nilai-nilai yang disensor.

Tidak begitu khas, contoh kehidupan nyata dari sensor diamati dalam skor ujian matura Polandia yang menarik cukup banyak perhatian di internet . Ujian diambil di akhir sekolah menengah dan siswa harus lulus agar dapat mendaftar ke pendidikan tinggi. Bisakah Anda menebak dari plot di bawah ini berapa jumlah minimal poin yang siswa butuhkan untuk lulus ujian? Tidak mengherankan, "celah" dalam distribusi normal dapat dengan mudah "diisi" jika Anda mengambil fraksi yang sesuai dari skor yang diwakili tepat di atas batas sensor.

masukkan deskripsi gambar di sini

Dalam hal analisis survival

penyensoran terjadi ketika kita memiliki beberapa informasi tentang waktu bertahan hidup individu, tetapi kita tidak tahu persis waktu bertahan hidup

(Kleinbaum dan Klein, 2005, hal. 5). Misalnya, Anda merawat pasien dengan beberapa obat dan mengamati mereka sampai akhir studi Anda, tetapi Anda tidak memiliki pengetahuan apa yang terjadi pada mereka setelah studi selesai (apakah ada kekambuhan atau efek samping?), Satu-satunya hal yang Anda tahu adalah mereka " selamat " setidaknya sampai akhir penelitian.

Di bawah ini Anda dapat menemukan contoh data yang dihasilkan dari distribusi Weibull yang dimodelkan menggunakan estimator Kaplan-Meier. Kurva biru menandai model yang diperkirakan pada dataset lengkap, di plot tengah Anda dapat melihat sampel yang disensor dan model yang diperkirakan pada data yang disensor (kurva merah), di sebelah kanan Anda melihat sampel terpotong dan model diperkirakan pada sampel tersebut (kurva merah). Seperti yang Anda lihat, data yang hilang (pemotongan) memiliki dampak signifikan pada perkiraan, tetapi sensor dapat dengan mudah dikelola menggunakan model analisis survival standar.

masukkan deskripsi gambar di sini

Ini tidak berarti bahwa Anda tidak dapat menganalisis sampel terpotong, tetapi dalam kasus seperti itu Anda harus menggunakan model untuk data yang hilang yang mencoba "menebak" informasi yang tidak diketahui.


Kleinbaum, DG dan Klein, M. (2005). Analisis Kelangsungan Hidup: Teks Belajar Mandiri. Peloncat.

Gelman, A., Carlin, JB, Stern, HS, dan Rubin, DB (2005). Analisis Data Bayesian. Chapman & Hall / CRC.

Tim
sumber
Apakah Anda tahu dari mana plot Matura ini berasal? Saya mencoba googling dan terus mendapatkan tautan reddit tetapi yang satu itu tidak mengandung referensi. Itu hanya mengarah ke imgur.com tanpa atribusi apa pun. PEMBARUAN: Ditemukan. cke.edu.pl//images/files/matura/informacje_o_wynikach/2013/… halaman 18.
amoeba mengatakan Reinstate Monica
1
@amoeba jika Anda tertarik dengan perincian lebih lanjut, jangan ragu untuk menghubungi saya. Sebagian besar materi tentang topik ini yang saya tahu sayangnya dalam bahasa Polandia. Gambarannya adalah satu hal tetapi seorang teman saya melakukan analisis yang lebih rinci tentang data ini (btw, tersedia berdasarkan permintaan).
Tim
2

Penyensoran merupakan pusat analisis kelangsungan hidup.

Ide dasarnya adalah bahwa informasi disensor, itu tidak terlihat oleh Anda. Cukup dijelaskan, distribusi waktu hidup yang disensor diperoleh jika Anda mencatat waktu hidup sebelum semua orang dalam sampel meninggal. Jika Anda berpikir tentang waktu yang bergerak "ke kanan" pada sumbu X, ini bisa disebut sensor-kanan.

Ada juga tipe lain: sensor kiri dan sensor jendela. Lihat misalnya, teks Allison tahun 1984 tentang Analisis Riwayat Kejadian, yang diterbitkan oleh Sage untuk pengantar instruktif.

Contoh: Jika Anda menghitung tingkat perceraian dalam populasi, Anda hanya ingin menyertakan individu yang berisiko bercerai (yaitu, mereka sudah menikah). Jika orang mengakhiri pernikahan mereka dengan alasan selain perceraian (berkabung, pembatalan) maka Anda ingin menyensornya. Mereka tidak lagi berisiko perceraian. Perkiraan Kaplan-Meier Anda (dan plot) tidak boleh menyertakan pengamatan yang disensor setelah titik waktu ketika mereka disensor, tetapi harus memasukkannya sampai titik waktu itu.

torkildl
sumber
Grafik atau plot?
RustyStatistician