Mengapa kemiringan selalu tepat 1 ketika melakukan regresi kesalahan pada residu menggunakan OLS?

10

Saya sedang bereksperimen dengan hubungan antara kesalahan dan residu menggunakan beberapa simulasi sederhana dalam R. Satu hal yang saya temukan adalah bahwa, terlepas dari ukuran sampel atau varians kesalahan, saya selalu mendapatkan tepat untuk lereng ketika Anda cocok dengan model1

errorsβ0+β1×residuals

Berikut simulasi yang saya lakukan:

n <- 10 
s <- 2.7 

x <- rnorm(n) 
e <- rnorm(n,sd=s)
y <- 0.3 + 1.2*x + e

model <- lm(y ~ x) 
r <- model$res 

summary( lm(e ~ r) )

edan rberkorelasi sangat (tetapi tidak sempurna), bahkan untuk sampel kecil, tapi saya tidak tahu mengapa ini terjadi secara otomatis. Penjelasan matematis atau geometris akan dihargai.

GoF_Logistic
sumber
5
Dalam bidang segitiga OXY, dengan basis OX, ketinggian sisi YO dan XY adalah ketinggian segitiga itu sendiri. Agar, mereka ketinggian diberikan oleh koefisien lm(y~r), lm(e~r), dan lm(r~r), yang karena itu semua harus sama. Yang terakhir jelas adalah . Coba ketiga perintah ini untuk melihat. Untuk membuat yang terakhir berfungsi di Anda harus membuat salinan , seperti . Untuk selengkapnya tentang diagram geometri regresi, lihat stats.stackexchange.com/a/113207 . 1Rrs<-r;lm(r~s)
whuber
1
Terima kasih @whuber. Apakah Anda ingin membuat selain jawaban sehingga saya dapat menerimanya, atau mungkin menandainya sebagai duplikat?
GoF_Logistic
1
Saya pikir itu bukan duplikat, jadi saya telah memperluas komentar menjadi sebuah jawaban.
whuber

Jawaban:

11

jawaban whuber sangat bagus! (+1) Saya mengatasi masalah menggunakan notasi yang paling akrab bagi saya dan menganggap derivasi (kurang menarik, lebih rutin) mungkin bermanfaat untuk dimasukkan di sini.

Biarkan menjadi model regresi, untuk X R n × p dan ϵ noise. Kemudian regresi y terhadap kolom X memiliki persamaan normal X T ( y - X β ) = 0 , menghasilkan estimasi β = ( X T X ) - 1 X T y .y=Xβ+ϵXRn×pϵyXXT(yXβ^)=0,

β^=(XTX)1XTy.
Oleh karena itu regresi memiliki residual untuk H = X ( X T X ) - 1 X T .
r=yXβ^=(IH)y=(IH)ϵ,
H=X(XTX)1XT

Kemunduran pada r hasil dalam perkiraan kemiringan yang diberikan oleh ( r T r ) - 1 r T εϵr karenaI-Hsimetris dan idempoten danϵim(X)hampir pasti.

(rTr)1rTϵ=([(IH)ϵ]T[(IH)ϵ])1[(IH)ϵ]Tϵ=ϵT(IH)TϵϵT(IH)T(IH)ϵ=ϵT(IH)ϵϵT(IH)ϵ=1,
IHϵim(X)

Lebih lanjut, argumen ini juga berlaku jika kita memasukkan intersep ketika kita melakukan regresi kesalahan pada residu jika intersep dimasukkan dalam regresi asli, karena kovariat bersifat ortogonal (yaitu , dari persamaan normal) .1Tr=0

pengguna795305
sumber
+1 Selalu menyenangkan melihat solusi bekerja dengan hati-hati dan jelas.
whuber
11

xeY=βx+ebβr=YbxO

Angka

βxeYbxYbxr

xOY(βx)YrrYrYererrr1


re=r+(βb)xY=e+βx=r+(2βb)xxxrr1xr

whuber
sumber