Sebagaimana dijelaskan dalam handout kursus ini (halaman 1) , model linear dapat ditulis dalam bentuk:
di mana adalah variabel respon dan adalah variabel penjelas .
Seringkali dengan tujuan memenuhi asumsi pengujian, seseorang dapat mengubah variabel respons. Misalnya kita menerapkan fungsi log pada setiap . Mengubah variabel respon TIDAK sama dengan melakukan GLM.
GLM dapat ditulis dalam bentuk berikut (dari handout kursus lagi (halaman 3) )
di mana hanyalah simbol lain untuk seperti yang saya mengerti dari halaman 2 dalam handout kursus. disebut fungsi tautan.
Saya tidak benar-benar memahami perbedaan antara GLM dan LM dengan variabel yang diubah dari slide dalam kursus. Bisakah Anda membantu saya dengan itu?
Jawaban:
Mengubah respons sebelum melakukan regresi linier adalah dengan melakukan ini:
di mana adalah fungsi yang diberikan, dan kami menganggap bahwa g ( Y ) memiliki distribusi yang diberikan (biasanya normal).g g(Y)
Model linier umum melakukan ini:
di mana sama dengan sebelumnya, dan kami berasumsi bahwa Y memiliki distribusi yang diberikan (biasanya tidak normal).g Y
sumber
Saya tidak yakin apakah ini akan menjadi jawaban yang lengkap untuk Anda, tetapi ini dapat membantu membebaskan kebuntuan konseptual.
Tampaknya ada dua kesalahpahaman di akun Anda:
Ingatlah bahwa regresi kuadrat terkecil (OLS - 'linear') adalah kasus khusus dari model linear umum. Jadi, ketika Anda mengatakan "[t] mengubah variabel respons TIDAK TIDAK sama dengan melakukan GLM", ini tidak benar. Memasang model linier atau mengubah variabel respons dan kemudian memasang model linier keduanya merupakan 'melakukan GLM'.
(I don't mean to be harping on mistakes, I just suspect that these may be causing your confusion.)
There is also another aspect of the generalized linear model that I don't see you mentioning. That is that we specify a response distribution. In the case of OLS regression, the response distribution is Gaussian (normal) and the link function is the identity function. In the case of, say, logistic regression (which may be what people first think of when they think of GLMs), the response distribution is the Bernoulli (/ binomial) and the link function is the logit. When using transformations to ensure the assumptions for OLS are met, we are often trying to make the conditional response distribution acceptably normal. However, no such transformation will make the Bernoulli distribution acceptably normal.
sumber