Dalam hal ini Anda dapat runtuh data ke
di mana S i j adalah jumlah kasus untuk x = i dan y = j dengan i , j ∈ { 0 , 1 } . Misalkan ada n pengamatan secara keseluruhan.
X∖Y010S00S101S01S11
Sijx=iy=ji,j∈{0,1}n
Jika kita sesuai dengan model (di mana g adalah fungsi link kami) kita akan menemukan bahwa β 0 adalah yang logit proporsi keberhasilan ketika x i = 0 dan ß 0 + β 1 adalah logit proporsi keberhasilan saatpi=g−1(xTiβ)=g−1(β0+β11xi=1)gβ^0xi=0β^0+β^1 . Dengan kata
lain, β 0 = g ( S 01xsaya= 1
dan
β 0+ β 1=g(S11
β^0= g( S01S00+ S01)
β^0+ β^1= g( S11S10+ S11) .
Mari kita periksa ini R
.
n <- 54
set.seed(123)
x <- rbinom(n, 1, .4)
y <- rbinom(n, 1, .6)
tbl <- table(x=x,y=y)
mod <- glm(y ~ x, family=binomial())
# all the same at 0.5757576
binomial()$linkinv( mod$coef[1])
mean(y[x == 0])
tbl[1,2] / sum(tbl[1,])
# all the same at 0.5714286
binomial()$linkinv( mod$coef[1] + mod$coef[2])
mean(y[x == 1])
tbl[2,2] / sum(tbl[2,])
Jadi koefisien regresi logistik adalah persis transformasi proporsi yang berasal dari tabel.
Hasilnya adalah kita tentu dapat menganalisis dataset ini dengan regresi logistik jika kita memiliki data yang berasal dari serangkaian variabel acak Bernoulli, tetapi ternyata tidak ada bedanya dengan langsung menganalisis tabel kontingensi yang dihasilkan.
Ysaya| xsaya∼⊥Bern ( hlmsaya)xsayahalsaya= g- 1( β0+ β1xsaya)xsayahalsayahal0hal1
∑i : xsaya= 0Ysaya= S01∼ Bin ( n0, hal0)
∑i : xsaya= 1Ysaya= S11∼ Bin ( n1, hal1) .
xsayan0n1
S01/ n0= S01S00+ S01→halhal0 dan S11/ n1= S11S10+ S11→halhal1.
Ysaya| xsaya= j ∼ Bern ( hlmj)Sj 1∼ Bin ( nj, halj)