Model Biner (Probit dan Logit) dengan Offset Logaritmik

12

Adakah yang memiliki derivasi bagaimana offset bekerja dalam model biner seperti probit dan logit?

Dalam masalah saya, jendela tindak lanjut dapat bervariasi panjangnya. Misalkan pasien mendapatkan suntikan profilaksis sebagai pengobatan. Tembakan terjadi pada waktu yang berbeda, jadi jika hasilnya adalah indikator biner dari apakah ada kambuh yang terjadi, Anda perlu menyesuaikan fakta bahwa beberapa orang memiliki lebih banyak waktu untuk menunjukkan gejala. Tampaknya kemungkinan flare-up sebanding dengan lamanya periode tindak lanjut. Tidak jelas bagi saya secara matematis bagaimana model biner dengan offset menangkap intuisi ini (tidak seperti dengan Poisson).

Offset adalah opsi standar pada Stata (hal.1666) dan R , dan saya dapat dengan mudah melihatnya untuk Poisson , tetapi kasingnya agak buram.

Misalnya, jika kita memiliki

E[y|x]Z=exp{xβ},
ini secara aljabar setara dengan model di mana
E[y|x]=exp{xβ+logZ},
yang merupakan model standar dengan koefisien padalogZdibatasi hingga1. Ini disebutoffset logaritmik. Saya mengalami kesulitan mencari tahu cara kerjanya jika kita menggantiexp{}denganΦ()atauΛ() .

Perbarui # 1:

Kasus logit dijelaskan di bawah ini.

Perbarui # 2:

Berikut adalah penjelasan tentang apa yang tampaknya menjadi penggunaan utama offset untuk model non-poisson seperti probit. Offset dapat digunakan untuk melakukan tes rasio kemungkinan pada koefisien fungsi indeks. Pertama, Anda memperkirakan model yang tidak dibatasi dan menyimpan estimasi. Katakanlah Anda ingin menguji hipotesis bahwa . Kemudian Anda membuat variabel z = 2 x , sesuai dengan model menjatuhkan x dan menggunakan z sebagai offset non-logaritmik. Ini adalah model yang dibatasi. Tes LR membandingkan keduanya, dan merupakan alternatif dari tes Wald yang biasa.βx=2z=2xxz

Dimitriy V. Masterov
sumber

Jawaban:

8

Anda selalu dapat menyertakan offset dalam GLM apa pun : itu hanya variabel prediktor yang koefisiennya tetap pada 1. Regresi Poisson kebetulan merupakan kasus penggunaan yang sangat umum.

Perhatikan bahwa dalam model binomial, analog ke eksposur log sebagai offset hanyalah penyebut binomial, jadi biasanya tidak perlu menentukannya secara eksplisit. Seperti halnya Anda dapat memodelkan RV Poisson sebagai hitungan dengan eksposur log sebagai offset, atau sebagai rasio dengan eksposur sebagai bobot, Anda juga dapat memodelkan RV binomial sebagai jumlah keberhasilan dan kegagalan, atau sebagai frekuensi dengan uji coba sebagai berat.

logZZp/(1p)

log(p/(1p))=βX+logZp/(1p)=Zexp(βX)

Tetapi ini tidak memiliki signifikansi tertentu seperti eksposur log dalam regresi Poisson. Yang mengatakan, jika probabilitas binomial Anda cukup kecil, model logistik akan mendekati model Poisson dengan tautan log (karena penyebut pada LHS mendekati 1) dan offset dapat diperlakukan sebagai istilah paparan log.

(Masalah yang dijelaskan dalam pertanyaan R tertaut Anda agak istimewa.)

Hong Ooi
sumber
t tPr(Y=1|X)=Φ(xβ+ln(t))tt
Ini bukan probabilitas, tetapi rasio odds. Semoga hasil edit membuatnya lebih jelas.
Hong Ooi
Mengekspresikan masalah dalam hal rasio odds membuatnya sangat jelas. Bagaimana dengan probit?
Dimitriy V. Masterov
Saya tidak berharap ini berfungsi untuk probit, atau setidaknya memiliki interpretasi yang bersih, karena bukan tautan kanonik, dan variabel dependen biner dengan probit tidak termasuk dalam keluarga eksponensial. Φ()
Tugas
@StasK Sepertinya itu benar, tetapi mengapa opsi ini ada di Stata dan R? Apa yang mereka capai?
Dimitriy V. Masterov
1

Memulihkan ini sebagai masalah waktu-ke-peristiwa, bukankah model logistik dengan offset (waktu) secara efektif akan mengikat Anda pada fungsi survival parametrik yang mungkin cocok atau tidak cocok dengan data?

p / (1-p) = Z * exp (xbeta)

p = [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

Kelangsungan hidup yang diprediksi pada saat Z = 1- [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

Eric
sumber