Saya sedang melihat beberapa masalah regresi logistik. ("reguler" dan "bersyarat").
Idealnya, saya ingin memberi bobot pada masing-masing kasus masukan sehingga GLM akan lebih fokus pada memprediksi kasing yang lebih tinggi dengan benar dengan mengorbankan kemungkinan kesalahan klasifikasi pada kasing yang lebih rendah.
Tentunya ini sudah dilakukan sebelumnya. Adakah yang bisa mengarahkan saya ke beberapa literatur yang relevan (Atau mungkin menyarankan fungsi kemungkinan dimodifikasi.)
Terima kasih!
Jawaban:
glm
memegang parameterweights
tepat untuk tujuan ini. Anda memberinya vektor angka pada skala apa pun, yang memiliki jumlah bobot yang sama dengan yang Anda amati.Saya baru sekarang menyadari bahwa Anda mungkin tidak berbicara
R
. Jika tidak, Anda mungkin mau.sumber
glm
(mungkin) menemukan implementasi C.Jika Anda memiliki akses ke SAS, ini sangat mudah dilakukan menggunakan PROC GENMOD. Selama setiap pengamatan memiliki variabel bobot, penggunaan pernyataan bobot akan memungkinkan Anda melakukan jenis analisis yang Anda cari. Saya sebagian besar menggunakannya menggunakan bobot Inverse-Probability-of-Treatment, tapi saya tidak melihat alasan mengapa Anda tidak dapat menetapkan bobot pada data Anda untuk menekankan jenis kasus tertentu, selama Anda memastikan N Anda tetap konstan. Anda juga ingin memastikan untuk memasukkan semacam variabel ID, karena secara teknis kasus-kasus yang kelebihan berat badan adalah pengamatan berulang. Kode contoh, dengan ID observasi 'id' dan variabel bobot 'wt':
sumber