Bagaimana cara menghitung interval prediksi untuk regresi berganda OLS?

24

Apa notasi aljabar untuk menghitung interval prediksi untuk regresi berganda?

Kedengarannya konyol, tetapi saya kesulitan menemukan notasi aljabar yang jelas tentang ini.

Michael
sumber

Jawaban:

31

Ambil model regresi dengan observasi dan regressor: \ mathbf {y = X \ beta + u} \ newcommand {\ Var} {\ rm Var}Nk

y=Xβ+u

Diberikan vektor x0 , nilai prediksi untuk pengamatan itu adalah

E[y|x0]=y^0=x0β^.
Estimator yang konsisten dari varian prediksi ini adalah
V^p=s2x0(XX)1x0,
s2=Σi=1Nu^i2Nk.
mana s ^ 2 = \ frac {\ Sigma_ {i = 1} ^ {N} \ hat u_i ^ 2} {Nk}. Kesalahan perkiraan untuk y0 tertentu adalah
e^=y0y^0=x0β+u0y^0.
Kovarians nol antara u0 dan β^ menyiratkan bahwa
Var[e^]=Var[y^0]+Var[u0],
dan penduga yang konsisten yaitu
V^f=s2x0(XX)1x0+s2.

The 1α confidence Interval akan:

y0±t1α/2V^p.
The 1α prediction Interval akan lebih luas:
y0±t1α/2V^f.

Dimitriy V. Masterov
sumber
Jawaban di atas dilakukan dengan sangat baik, tetapi saya pikir sumber ini membantu menyediakan beberapa konteks untuk pertanyaan itu.
Skeeter Juni
@ Dimitriy Saya yakin eqn kedua Anda harus memiliki wortel / topi, '^', di atas . β
Don Slowik
Bukankah ramalan ramalan merupakan residual: ? e^=u^
Don Slowik