Apa perbedaan statistik antara melakukan regresi linier dalam R dengan formula
himpunan y ~ x + 0
bukan y ~ x
? Bagaimana cara saya menafsirkan dua hasil yang berbeda itu?
11
Apa perbedaan statistik antara melakukan regresi linier dalam R dengan formula
himpunan y ~ x + 0
bukan y ~ x
? Bagaimana cara saya menafsirkan dua hasil yang berbeda itu?
Menambahkan +0
(atau -1
) ke formula model (misalnya, dalam lm()
) di R menekan intersep. Ini umumnya dianggap hal buruk untuk dilakukan; Lihat:
Estimasi kemiringan dihitung secara berbeda tergantung pada apakah intersep diestimasi juga, yaitu:
Berikut adalah rumus yang mendasari:
Itu tergantung pada konteks (tentu saja), dalam
lm(...)
perintah di R itu akan menekan intersep. Artinya, Anda melakukan regresi melalui asalnya.Perhatikan bahwa sebagian besar buku teks tentang masalah regresi, akan memberi tahu Anda bahwa pemaksaan intersep (ke nilai apa pun) adalah ide yang buruk.
Interpretasi x tidak berubah, tetapi nilainya (membandingkan dengan dan tanpa intersep) akan berubah, terkadang sangat signifikan.
sumber