Dengan data kontinu, regresi linier mengasumsikan bahwa istilah kesalahan didistribusikan N (0, )σ 2
1) Apakah kita berasumsi bahwa Var (Y | x) juga ~ N (0, )?
2) Apa distribusi kesalahan ini dalam regresi logistik? Ketika data dalam bentuk 1 catatan per kasus, di mana "Y" adalah 1 atau 0, adalah istilah kesalahan yang didistribusikan Bernoulli (yaitu varians adalah p (1-p))) dan ketika data dalam bentuk # Berhasil dari uji #of, apakah diasumsikan binomial (yaitu varians adalah np (1-p)), di mana p adalah probabilitas bahwa Y adalah 1?
logistic
generalized-linear-model
B_Miner
sumber
sumber
Jawaban:
1) Jika memiliki distribusi normal yaitu maka , karena bukan variabel acak.u V a r (N(0,σ2) β 1 + β 2 X 2Var(Y|X2)=Var(β1+β2X2)+Var(u)=0+σ2=σ2 β1+β2X2
2) Dalam regresi logistik, diasumsikan bahwa kesalahan mengikuti distribusi binomial seperti yang disebutkan di sini . Lebih baik menuliskannya sebagai , karena probabilitas tersebut bergantung pada , sebagaimana dirujuk di sini atau di Regresi Logistik Terapan .Var(Yj|Xj)=mj.E[Yj|Xj].(1−E[Yj|Xj])=mjπ(Xj).(1−π(Xj)) Xj
sumber