Mengapa regresi linier dan Model Umum memiliki asumsi yang tidak konsisten?
- Dalam regresi linier, kita asumsikan residual berasal dari Gaussian
- Dalam regresi lain (regresi logistik, regresi racun), kami menganggap respons datang dari beberapa distribusi (binomial, poission dll).
Mengapa kadang-kadang berasumsi sisa dan waktu lain menganggap pada respons? Apakah karena kita ingin mendapatkan properti yang berbeda?
EDIT: Saya pikir menunjukkan mark999 dua bentuk sama. Namun, saya punya satu keraguan tambahan pada iid:
Pertanyaan saya yang lain, Apakah ada asumsi awal tentang regresi logistik? menunjukkan model linier umum tidak memiliki asumsi iid (independen tetapi tidak identik)
Apakah benar bahwa untuk regresi linier, jika kita mengajukan asumsi pada residual , kita akan memiliki iid, tetapi jika kita mengajukan asumsi pada respons , kita akan memiliki sampel yang independen tetapi tidak identik (Gaussian berbeda dengan berbeda )?
Jawaban:
Regresi linier sederhana yang memiliki kesalahan Gaussian adalah atribut yang sangat bagus yang tidak digeneralisasi ke model linear umum.
Dalam model linier umum, respon mengikuti beberapa distribusi yang diberikan diberikan rata-rata . Regresi linier mengikuti pola ini; jika kita punya
maka kita juga punya
Berikut beberapa
R
kode untuk diilustrasikan.sumber
Model regresi linier berganda yang biasa dengan kesalahan normal adalah model linier umum dengan respons normal dan hubungan identitas.
sumber