Model efek acak menangani redudansi

9

Saya mencoba untuk berurusan dengan analisis waktu ke acara menggunakan hasil biner berulang. Misalkan waktu-ke-peristiwa diukur dalam beberapa hari tetapi untuk saat ini kami memutuskan waktu ke minggu. Saya ingin memperkirakan estimator Kaplan-Meier (tetapi memungkinkan untuk kovariat) menggunakan hasil biner berulang. Ini akan tampak seperti cara bundaran untuk pergi, tetapi saya sedang mengeksplorasi bagaimana ini meluas ke hasil ordinal dan peristiwa berulang.

Jika Anda membuat urutan biner yang terlihat seperti 000 untuk seseorang yang disensor pada 3 minggu, 0000 untuk seseorang yang disensor pada 4w, dan 0000111111111111 .... untuk subjek yang gagal pada 5w (1s meluas ke titik di mana subjek terakhir adalah diikuti dalam penelitian), ketika Anda menghitung proporsi spesifik 1 minggu Anda bisa mendapatkan insiden kumulatif biasa (sampai Anda mendapatkan waktu sensor variabel, di mana ini hanya mendekati tetapi tidak sama dengan estimasi insiden kumulatif Kaplan-Meier).

Saya bisa menyesuaikan pengamatan biner berulang dengan model logistik biner menggunakan GEE, bukannya membuat waktu diskrit seperti di atas tetapi menggunakan spline dalam waktu. Penaksir kovarian sandwich sandwich bekerja cukup baik. Tetapi saya ingin mendapatkan kesimpulan yang lebih tepat dengan menggunakan model efek campuran. Masalahnya adalah bahwa 1 setelah 1 pertama adalah mubazir. Adakah yang tahu cara menentukan efek acak atau menentukan model yang memperhitungkan redudansi sehingga kesalahan standar tidak akan kempes?

Perhatikan bahwa pengaturan ini berbeda dari Efron karena ia menggunakan model logistik untuk memperkirakan probabilitas bersyarat dalam set risiko. Saya memperkirakan probabilitas tanpa syarat.

Frank Harrell
sumber

Jawaban:

3

Sejauh yang saya bisa lihat dengan GEE atau model campuran untuk pengamatan biner berulang, Anda akan memiliki masalah bahwa model akan menetapkan probabilitas positif untuk '0' setelah yang pertama '1' telah diamati.

Bagaimanapun, mengingat bahwa Anda ingin mendapatkan perkiraan dari regresi logistik efek campuran yang akan memiliki interpretasi yang sama seperti di GEE (lihat di sini untuk info lebih lanjut), Anda dapat menyesuaikan model menggunakan mixed_model()fungsi dari paket GLMMadaptive , dan kemudian gunakan marginal_coefs(). Sebagai contoh, lihat di sini .

Dimitris Rizopoulos
sumber
1
Terima kasih Dimitris. Untuk kasus saya dengan redundant 1 (untuk mendapatkan fungsi rata yang tepat) saya pikir saya akan membutuhkan model yang dimodifikasi atau pengaturan efek acak yang aneh. The GLMMadaptivepaket terlihat hebat untuk setup yang lebih umum.
Frank Harrell
2

Beberapa pemikiran tentang ini:

  1. Tampaknya model efek campuran pada dasarnya merupakan model probabilitas 'kondisional', yaitu, berapa probabilitas suatu peristiwa untuk subjek yang berisiko terhadap peristiwa itu.

  2. Kita tahu probabilitas '1' setelah yang pertama '1' adalah satu. Dengan demikian, tidak ada informasi tambahan dalam nilai '1' berikutnya.

  3. Tampaknya, karena nilai-nilai '1' berikutnya tidak mengandung informasi tambahan, nilai-nilai itu seharusnya tidak berdampak pada fungsi kemungkinan, dan dengan demikian tidak berdampak pada kesalahan standar dari penaksir berbasis kemungkinan, maupun perkiraan itu sendiri. Memang, tidak akan ada dampak dari nilai '1' berikutnya jika p (y = '1' | x) = 1 terlepas dari nilai parameter model, sebagaimana mestinya.

  4. Kita mungkin dapat memaksa perilaku ini (yaitu, p (y = '1' | x) = 1), dan mempertahankan fungsi rata-rata yang diinginkan, dengan menambahkan indikator kovariat ke model yang menandai yang berikutnya, dan dengan memaksakan koefisiennya menjadi sangat besar sehingga efektif p (y = '1' | x) = 1.

  5. Seperti yang Anda sebutkan, mungkin juga ada cara untuk memaksa '1' pertama dan tanggapan selanjutnya memiliki korelasi 100%. Tetapi dalam model binomial, itu sama dengan p (y = '1' | x) = 1 untuk respons selanjutnya.

Matt Shotwell
sumber
1
Terima kasih, Matt. Jika saya tidak menginginkan model lengkap tetapi puas dengan memperkirakan persamaan, yang Anda dapatkan adalah menambahkan respons duplikat ke fungsi skor untuk mendapatkan fungsi rata-rata dengan benar, tetapi tidak menambahkannya ke fungsi informasi. Saya tidak berpikir saya dapat menambahkan indikator kovariat, karena itu akan memakan waktu mulai dari, misalnya, efek pengobatan. Saya pikir model efek campuran lebih dari model tanpa syarat. Saat acara bukan kondisi menyerap, Anda memodelkan efek marginal dengan cara yang tergantung waktu.
Frank Harrell
1

Saya tidak yakin apa yang Anda coba lakukan, tetapi dapatkah Anda mencocokkan model regresi logistik yang dikumpulkan ( https://www.ncbi.nlm.nih.gov/pubmed/2281238 )? Dalam hal ini Anda hanya akan memasukkan 1 selama interval acara terminal - itu tidak akan diulang setelah acara terjadi. Anda akan memasukkan waktu dalam model dengan cara yang fleksibel (misalnya, diperluas menggunakan splines).

Bryan Shepherd
sumber
1
Hei Bryan - Saya sangat suka regresi logistik gabungan dan telah sering menggunakannya. Tetapi jika Anda menghentikan pengamatan subjek di acara terminal, dan memiliki subjek lain diikuti di luar titik itu tanpa acara, Anda akan mendapatkan fungsi rata-rata (P (event by time t)) salah. Saya ingin mendapatkan perkiraan kejadian kumulatif dekat-Kaplan-Meier untuk fungsi rata-rata setidaknya dalam kasus-kasus khusus.
Frank Harrell