Sensor interval

8

Saya menjalankan kurva survival sensor interval dengan R, JMP dan SAS. Mereka berdua memberi saya grafik yang sama, tetapi tabelnya sedikit berbeda. Ini adalah tabel yang diberikan JMP padaku.

Start Time  End Time    Survival    Failure SurvStdErr
.            14.0000      1.0000     0.0000     0.0000
16.0000      21.0000      0.5000     0.5000     0.2485
28.0000      36.0000      0.5000     0.5000     0.2188
40.0000      59.0000      0.2000     0.8000     0.2828
59.0000      91.0000      0.2000     0.8000     0.1340
94.0000     .             0.0000     1.0000     0.0000

Ini adalah tabel yang diberikan SAS kepada saya:

Obs Lower Upper Probability Cum Probability Survival Prob Std.Error
1    14    16      0.5          0.5             0.5        0.1581
2    21    28      0.0          0.5             0.5        0.1581
3    36    40      0.3          0.8             0.2        0.1265
4    91    94      0.2          1.0             0.0        0.0

R memiliki output yang lebih kecil. Grafiknya identik, dan hasilnya adalah:

Interval (14,16] -> probability 0.5
Interval (36,40] -> probability 0.3
Interval (91,94] -> probability 0.2

Masalah saya adalah:

  1. Saya tidak mengerti perbedaannya
  2. Saya tidak tahu bagaimana menafsirkan hasil ...
  3. Saya tidak mengerti logika di balik metode ini.

Jika Anda dapat membantu saya, terutama dengan interpretasi, itu akan sangat membantu. Saya perlu merangkum hasil dalam beberapa baris dan tidak yakin bagaimana cara membaca tabel.

Saya harus menambahkan bahwa sampel hanya memiliki 10 pengamatan, sayangnya, interval di mana peristiwa terjadi. Saya tidak ingin menggunakan metode perhitungan titik tengah yang bias. Tetapi saya memiliki dua interval (2,16), dan orang pertama yang tidak bertahan hidup gagal pada angka 14 dalam analisis, jadi saya tidak tahu bagaimana ia melakukan apa yang dilakukannya.

Grafik:

masukkan deskripsi gambar di sini

pengguna45442
sumber
1
Sebenarnya, Rdan SASsepenuhnya setuju satu sama lain: SAStermasuk 4 interval, bukan 3, tetapi perhatikan bahwa CDF tidak berubah dalam interval 2! Faktanya, JMPhasilnya juga setuju, tetapi sedikit lebih sulit untuk diikuti.
Cliff AB

Jawaban:

1

Masalah yang paling penting di sini adalah pemahaman tentang sensor dan jenis apa yang berlaku dalam situasi Anda. Jadi untuk masalah Anda 1. dan 3., pahami konteks masalah Anda. Ini akan membantu Anda menentukan metode sensor yang tepat.

Keluaran R mengatakan bahwa kelompok kegagalan pertama adalah dalam interval (14,16). Ini tidak berarti kegagalan terjadi pada 14. Itu berarti bahwa R menganggap data menjadi sensor-kanan, yang merupakan asumsi paling umum untuk analisis survival. Mengapa kegagalan dikutip sebagai rentang (14,16) dibandingkan dengan hanya probabilitas pada 16? Kemungkinan karena estimasi batas kepercayaan.

Menafsirkan hasil R, yang mirip dengan SAS: Probabilitas kegagalan pada t = 16 adalah 50%, pada t = 40 adalah 30%, pada t = 94 adalah 20%.

Lupakan tentang mencoba memahami masalah dengan menggunakan tiga paket analisis. Pilih satu, pahami opsi yang bisa Anda atur untuk menyensor, dan gunakan. Tautan yang baik untuk R: di sini

Gary Chung
sumber
Konteks pertanyaan adalah kekambuhan suatu kondisi. Saya tertarik pada saat kambuh. Sayangnya, kunjungan tindak lanjut tidak setiap hari, jadi jika pada kunjungan nomor 4 kambuh, saya tidak tahu di mana antara 3 (+ sehari) dan 4 terjadi. Sensor adalah sensor benar, dan di antara 10 pengamatan hanya 1 yang disensor (94, tak terbatas). Apakah benar mengatakan bahwa 50% bertahan lebih dari 28 hari?
user45442
dan satu pertanyaan lagi, karena sensor interval didasarkan pada data yang tidak diketahui, seberapa efisien estimasi berdasarkan 10 pengamatan? Apakah perkiraan benar-benar lebih baik daripada yang saya dapatkan dalam bias imputasi titik tengah, di mana saya mengambil rata-rata setiap interval untuk mewakili interval?
user45442
1
Saya tidak akan mengatakan 50% bertahan 28 hari atau lebih, karena Anda tidak tahu itu karena alasan ketidakpastian selama interval yang Anda tunjukkan. Anda dapat mengatakan bahwa 50% bertahan hingga Hari 16. Mengenai masalah interval, Anda memunculkan masalah yang sangat nyata yang berkaitan dengan ketidaktepatan data. Menggunakan metode titik tengah imputasi masuk akal, tetapi pendekatan yang diterima secara luas untuk situasi Anda adalah estimasi Kaplan Meier .
Gary Chung
3
@ GaryChung: Anda sepenuhnya mengabaikan aspek sensor interval data ini.
Cliff AB