Saya memiliki percobaan yang akan menghasilkan pengamatan waktu sampai suatu peristiwa terjadi. Beberapa sifat dasar adalah itu
- Kami menghitung jumlah peristiwa yang terjadi di beberapa titik .
- Waktu acara disensor interval, antara ,
- Individu tidak akan meninggalkan persidangan antara , itu adalah individu yang mengalami acara dengan atau tidak, pada titik mana mereka disensor,
- Sebagian besar individu tidak akan menerima acara dengan , saat kami mengakhiri eksperimen, dan
- Saya tidak dapat mengasumsikan model peluruhan parametrik yang mendasarinya.
Tampaknya menjadi aplikasi alami untuk analisis kelangsungan hidup. Namun, ini diperumit oleh fakta bahwa itu sepele untuk mengulangi percobaan dari konfigurasi awal yang sama beberapa kali. Akibatnya, kita akan memiliki satu set jumlah acara (di mana adalah jumlah sampel) untuk setiap waktu pengamatan . Saya relatif baru dalam statistik, dan saya berjuang untuk melihat bagaimana menerapkan analisis survival pada data ini (jika itu berlaku dan tidak ada metode yang lebih tepat untuk mengukur data waktu-ke-peristiwa semacam ini). Kecenderungan saya adalah untuk membangun fungsi bertahan hidup di sekitar jumlah rata-rata peristiwa yang diamati pada setiap interval (yaitu), yang seharusnya lebih mendekati perkiraan jumlah kejadian pada setiap interval dalam populasi, namun saya tidak tahu apakah ini tepat atau implikasinya.
Saya sudah mencari tanpa hasil di Google Cendekia, jika ada yang bisa mengarahkan saya ke lebih banyak materi (atau memberi saya nomenklatur yang tepat untuk apa yang saya coba lakukan), itu akan dihargai.
Edit
Mengingat bahwa interval seragam di semua sampel, katakan bahwa saya memiliki matriks berikut yang menggambarkan jumlah kumulatif individu yang mengalami peristiwa dalam setiap interval
di mana setiap baris memberikan jumlah peristiwa untuk set individu yang sama berisiko pada di semua sampel (yaitu beberapa contoh percobaan), dan setiap kolom adalah interval pengamatan. Saya berasumsi bahwa dengan mengambil rata-rata jumlah kejadian untuk setiap interval, saya bisa mendapatkan estimasi yang lebih baik untuk bertahan hidup penduduk diharapkan, jadi mari menunjukkan jumlah interval waktu, menunjukkan jumlah sampel (contoh percobaan), maka vektor
akan menjadi jumlah rata-rata peristiwa yang diamati untuk setiap interval waktu.
Maka, tujuan saya adalah menggunakan ini sebagai masukan untuk estimasi kelangsungan hidup. Biarkan menjadi jumlah individu yang berisiko ketika . Menggunakan estimator naif (untuk saat ini, mengingat bahwa interval acara seragam di semua sampel dan tidak ada sensor hingga ), fungsi survivor dapat diperkirakan sebagai:
Yang (diharapkan) akan menjadi estimasi yang lebih baik untuk kelangsungan hidup populasi daripada sampel individu (satu baris dari ). Untuk merumuskan kembali pertanyaan saya:
- Apakah input yang tepat untuk estimasi fungsi survival? Saya belum melihat pendekatan ini dalam salah satu bahan yang saya baca.
- Karena saya benar-benar, seorang pemula dalam bidang statistik, dapatkah seseorang mengarahkan saya ke beberapa materi (makalah akademis, buku teks, wiki dll. Akan baik-baik saja) dalam memperkirakan interval kepercayaan dan varians untuk estimasi fungsi survival ini? Saya kira itu tidak akan identik dengan formulasi standar.
Maaf jika pertanyaan awal saya membingungkan, saya mungkin tidak memasukkan informasi yang cukup.
Jawaban:
Saya baru-baru ini memiliki satu set data survival yang disensor interval, jadi saya tahu persis apa yang Anda butuhkan. Jika Anda pernah menggunakannya
R
, ini akan membantu.Jika Anda tidak ingin mengambil bentuk parametrik, bagaimana dengan model bahaya proporsional Cox interval yang disensor? The
intcox
paket yang akan melakukan hal ini tidak lagi diR
repositori. Saya akan menyarankan menghitung waktu bertahan hidup dan kemudian menggunakancoxph
fungsi darisurvival
perpustakaan. Ingatlah bahwa kesalahan standar Anda akan terlalu rendah menggunakan metode ini; Anda belum memperhitungkan ketidakpastian karena tidak mengetahui waktu hidup yang pasti. Jika Anda ingin perkiraan kelangsungan hidup yang disensor interval, gunakanicfit
fungsi dariinterval
paket.Cara lain menganalisis efek kovariat pada waktu bertahan hidup adalah dengan menggunakan interval disensor, regresi nonparametrik. Lihat
R
paketICE
: http://cran.r-project.org/web/packages/ICE/ICE.pdf . Pertama-tama Anda harus menentukan titik tengah waktu bertahan hidup, kemudian Anda melakukan regresi linier lokal menggunakanlocpoly
fungsi darinp
paket. Tidak sesulit kedengarannya.sumber
Fungsi survival biasanya benar-terus menerus karena ini adalah fungsi distribusi, saya akan gunakanSebuahk: = [tk - 1,tk) , k = 1 , 2 , ⋯ , n sebagai interval.
MembiarkanTsaya j dan Csaya j menjadi kelangsungan hidup terus menerus yang sebenarnya dan menyensor waktu untuk subjek j dalam sampel saya masing-masing. Kedua variabel tidak dapat diamati secara langsung, tetapi hanya dalam satu intervalSebuah1,Sebuah2, ⋯ . Selanjutnya, mariXsaya j menunjukkan interval di mana Tsaya j jatuh, pada dasarnya waktu bertahan hidup diskrit, dan juga Csaya j untuk Csaya j . Kemudian indikator sensor diberikan olehδsaya j= 1 (Xsaya j≤Csaya j) .
Fungsi bahayahsaya j( x ) untuk waktu kelangsungan hidup diskrit didefinisikan sebagai probabilitas bersyarat dari peristiwa yang terjadi di x Interval waktu yang diberikan belum terjadi sebelum x - 1 Interval th, yaitu
dan fungsi survival yang sesuaiSsaya j= P( X> x ) dapat ditulis secara rekursif menggunakan hukum produk bersyarat:
Fungsi kemungkinan pasangan(xsaya j,δsaya j) dapat dibangun sebagai produk dari dua jenis mata pelajaran, yaitu mereka yang mengalami suatu peristiwa di xsaya j (Xsaya j=xsaya j,δsaya j= 1 ) dan mereka yang disensor di xsaya j (Xsaya j>xsaya j,δsaya j= 0 ):
Sekarang jika kita merekonstruksi data kita ke dalam struktur riwayat peristiwa, yaitu merekam pada setiap interval, variabel indikator peristiwayi j k Untuk k interval interval j subjek dari sampel saya , kita bisa melihatnya δsaya jcatatan[hsaya j(xsaya j) / ( 1 -hsaya j(xsaya j) ] di atas ditulis ulang menjadi ∑xsaya jk = 1yi j kcatatan[hsaya j( k ) / ( 1 -hsaya j( k ) ) ] (pada dasarnya menjumlahkan semua 0 sampai interval pengamatan terakhir dari subjek ini, jika ia memiliki peristiwa, itu akan menjadi 1, jika disensor 0). Kemudian kita dapat menulis ulang kemungkinan log kita sebagai
Sekarang kami akhirnya dapat menjawab pertanyaan Anda. Jika kita mengasumsikan, bahwa pada interval yang sama,yi j k adalah IID untuk subjek yang berbedaj dalam sampel saya , dan juga di berbagai sampel, lalu M.j¯= (∑sayansaya)- 1∑si = 1∑nsayaj = 1yi j k adalah penaksir yang tepat untuk hsaya j( k ) = h ( k ) .
Dan penaksir yang tepat untukS(x ) oleh karena itu S^( x ) =∏xk = 1( 1 -M.¯j) .
sumber