Apakah ada metode untuk mengoreksi bias dalam model hazard proporsional Cox yang disebabkan oleh sampel yang dipilih secara tidak acak (seperti koreksi Heckman)?
Latar belakang :
Katakanlah situasinya terlihat sebagai berikut:
- Selama dua tahun pertama semua klien diterima.
- Setelah dua tahun model Cox PH dibangun. Model memprediksi berapa lama klien akan menggunakan layanan kami.
- Karena kebijakan perusahaan mulai sekarang hanya klien dengan kemungkinan bertahan 3 bulan lebih besar dari 0,5 yang diterima, yang lain ditolak.
- Setelah dua tahun model baru perlu dibangun. Masalahnya adalah kita hanya memiliki target untuk klien yang diterima dan hanya menggunakan klien ini dapat menyebabkan beberapa bias serius.
Jawaban:
Ada solusi yang diusulkan untuk model bahaya parametrik. Lihatlah ini:
Prieger, James, 2000. "Model Seleksi Parametrik Umum untuk Data Non-normal," Kertas Kerja 00-9, Universitas California di Davis, Departemen Ekonomi.
Boehmke, Frederick J., Daniel Morey, dan Megan Shannon. 2006. "Seleksi Bias dan Model Durasi Berkelanjutan: Konsekuensi dan Solusi yang Diusulkan." American Journal of Political Science 50 (1): 192-207.
Ada kode untuk makalah nanti di Stata, paket "dursel"
Namun, saya tidak mengetahui solusi untuk model Cox semiparametrik.
sumber
Jawaban sederhananya adalah memberi bobot. Artinya, Anda dapat menggunakan bobot untuk membakukan kelompok dalam kelompok "diterima" untuk populasi yang diminati. Masalah yang muncul dari penggunaan bobot tersebut dalam analisis yang dikumpulkan menggunakan fase 2 tahun pertama dan kedua adalah bahwa estimasi bobot populasi dan parameter sekarang tergantung. Pendekatan pseudolikelihood biasanya digunakan (dalam hal ini, itu akan menjadi semacam kemungkinan pseudo-parsial) di mana Anda mengabaikan ketergantungan antara berat sampel dan perkiraan parameter. Namun, dalam banyak keadaan praktis (dan yang ini tidak berbeda), akuntansi untuk ketergantungan ini diperlukan. Masalah membuat estimator yang efisien dari rasio bahaya adalah yang sulit, dan sejauh yang saya tahu terbuka berakhir.
Peningkatan Estimasi Horvitz-Thompson untuk Parameter Model dari Sampel Dua-Tingkat Stratifikasi: Aplikasi dalam Epidemiologi .
Artikel ini membahas metode survei, biasanya diterapkan dalam regresi logistik, namun Anda juga dapat mempertimbangkan data kelangsungan hidup. Beberapa pertimbangan penting yang Anda lupa sebutkan adalah apakah Anda tertarik untuk membuat prediksi yang berlaku untuk seluruh populasi, atau populasi "yang memenuhi syarat" berdasarkan perkiraan 2 tahun, atau populasi "yang memenuhi syarat" berdasarkan hasil yang dihasilkan model. Anda juga belum menyebutkan dengan tepat bagaimana model "prediksi" tersebut dibuat dari model Cox, karena nilai yang sesuai dari model Cox tidak dapat diartikan sebagai risiko. Saya kira Anda memperkirakan rasio bahaya, lalu mendapatkan estimasi yang mulus dari fungsi bahaya dasar.
sumber