Apa rumus y ~ x + 0 dalam R sebenarnya menghitung?

11

Apa perbedaan statistik antara melakukan regresi linier dalam R dengan formulahimpunan y ~ x + 0bukan y ~ x? Bagaimana cara saya menafsirkan dua hasil yang berbeda itu?

JimBoy
sumber

Jawaban:

18

Menambahkan +0(atau -1) ke formula model (misalnya, dalam lm()) di R menekan intersep. Ini umumnya dianggap hal buruk untuk dilakukan; Lihat:

Estimasi kemiringan dihitung secara berbeda tergantung pada apakah intersep diestimasi juga, yaitu:

(with intercept)β^1=xiyi(xi)(yi)Nxi2(xi)2N(without intercept)β^1=xiyixi2

0

R2

Berikut adalah rumus yang mendasari:

(with intercept)R2=1(yiy^i)2(yiy¯)2(without intercept)R2=1(yiy^i)2yi2
gung - Pasang kembali Monica
sumber
Terima kasih, gung! Jika saya menekan Intercept, multi-kuadrat saya membaik, tiba-tiba. Bisakah Anda membantu saya di sini?
JimBoy
6
Tidak ada cara yang disepakati untuk menghitung r kuadrat tanpa intersep. R kuadrat tidak memiliki interpretasi yang biasa. Melakukan regresi tanpa intersep hampir selalu merupakan ide yang SANGAT buruk
Repmat
5

Itu tergantung pada konteks (tentu saja), dalam lm(...)perintah di R itu akan menekan intersep. Artinya, Anda melakukan regresi melalui asalnya.

Perhatikan bahwa sebagian besar buku teks tentang masalah regresi, akan memberi tahu Anda bahwa pemaksaan intersep (ke nilai apa pun) adalah ide yang buruk.

Interpretasi x tidak berubah, tetapi nilainya (membandingkan dengan dan tanpa intersep) akan berubah, terkadang sangat signifikan.

Repmat
sumber
Terima kasih, Repmat! Saya mendapatkan perkiraan yang sangat berbeda jika saya menekan intersep dibandingkan dengan ketika saya tidak melakukannya. Selain itu, semua uji-t menjadi sangat signifikan. Apakah Anda tahu mengapa ini terjadi?
JimBoy
2
Intersep akan menyerap variabel tidak berarti 0 yang tidak terkandung dalam model. Dengan intersep hilang, varians harus pergi ke suatu tempat. Inilah sebabnya mengapa kebanyakan buku, sebagai aturan umum, menyatakan bahwa regresi tanpa intersep selalu salah. Artinya, OLS selalu bias dan konsisten dalam kasus ini (dengan beberapa pengecualian).
Repmat