Saya mencoba untuk berurusan dengan analisis waktu ke acara menggunakan hasil biner berulang. Misalkan waktu-ke-peristiwa diukur dalam beberapa hari tetapi untuk saat ini kami memutuskan waktu ke minggu. Saya ingin memperkirakan estimator Kaplan-Meier (tetapi memungkinkan untuk kovariat) menggunakan hasil biner berulang. Ini akan tampak seperti cara bundaran untuk pergi, tetapi saya sedang mengeksplorasi bagaimana ini meluas ke hasil ordinal dan peristiwa berulang.
Jika Anda membuat urutan biner yang terlihat seperti 000 untuk seseorang yang disensor pada 3 minggu, 0000 untuk seseorang yang disensor pada 4w, dan 0000111111111111 .... untuk subjek yang gagal pada 5w (1s meluas ke titik di mana subjek terakhir adalah diikuti dalam penelitian), ketika Anda menghitung proporsi spesifik 1 minggu Anda bisa mendapatkan insiden kumulatif biasa (sampai Anda mendapatkan waktu sensor variabel, di mana ini hanya mendekati tetapi tidak sama dengan estimasi insiden kumulatif Kaplan-Meier).
Saya bisa menyesuaikan pengamatan biner berulang dengan model logistik biner menggunakan GEE, bukannya membuat waktu diskrit seperti di atas tetapi menggunakan spline dalam waktu. Penaksir kovarian sandwich sandwich bekerja cukup baik. Tetapi saya ingin mendapatkan kesimpulan yang lebih tepat dengan menggunakan model efek campuran. Masalahnya adalah bahwa 1 setelah 1 pertama adalah mubazir. Adakah yang tahu cara menentukan efek acak atau menentukan model yang memperhitungkan redudansi sehingga kesalahan standar tidak akan kempes?
Perhatikan bahwa pengaturan ini berbeda dari Efron karena ia menggunakan model logistik untuk memperkirakan probabilitas bersyarat dalam set risiko. Saya memperkirakan probabilitas tanpa syarat.
sumber
GLMMadaptive
paket terlihat hebat untuk setup yang lebih umum.Beberapa pemikiran tentang ini:
Tampaknya model efek campuran pada dasarnya merupakan model probabilitas 'kondisional', yaitu, berapa probabilitas suatu peristiwa untuk subjek yang berisiko terhadap peristiwa itu.
Kita tahu probabilitas '1' setelah yang pertama '1' adalah satu. Dengan demikian, tidak ada informasi tambahan dalam nilai '1' berikutnya.
Tampaknya, karena nilai-nilai '1' berikutnya tidak mengandung informasi tambahan, nilai-nilai itu seharusnya tidak berdampak pada fungsi kemungkinan, dan dengan demikian tidak berdampak pada kesalahan standar dari penaksir berbasis kemungkinan, maupun perkiraan itu sendiri. Memang, tidak akan ada dampak dari nilai '1' berikutnya jika p (y = '1' | x) = 1 terlepas dari nilai parameter model, sebagaimana mestinya.
Kita mungkin dapat memaksa perilaku ini (yaitu, p (y = '1' | x) = 1), dan mempertahankan fungsi rata-rata yang diinginkan, dengan menambahkan indikator kovariat ke model yang menandai yang berikutnya, dan dengan memaksakan koefisiennya menjadi sangat besar sehingga efektif p (y = '1' | x) = 1.
Seperti yang Anda sebutkan, mungkin juga ada cara untuk memaksa '1' pertama dan tanggapan selanjutnya memiliki korelasi 100%. Tetapi dalam model binomial, itu sama dengan p (y = '1' | x) = 1 untuk respons selanjutnya.
sumber
Saya tidak yakin apa yang Anda coba lakukan, tetapi dapatkah Anda mencocokkan model regresi logistik yang dikumpulkan ( https://www.ncbi.nlm.nih.gov/pubmed/2281238 )? Dalam hal ini Anda hanya akan memasukkan 1 selama interval acara terminal - itu tidak akan diulang setelah acara terjadi. Anda akan memasukkan waktu dalam model dengan cara yang fleksibel (misalnya, diperluas menggunakan splines).
sumber