Mengapa korelasi residu tidak penting saat menguji normalitas?

9

Ketika (yaitu, Y berasal dari model regresi linier), ε N ( 0 , σ 2 I )Y=AX+εY Dan dalam kasus residu e 1 , ... , e n berkorelasi dan tidak independen. Tetapi ketika kita melakukan diagnosa regresi dan ingin menguji asumsi ε ~ N ( 0 , σ 2 I ) , setiap buku teks menyarankan untuk menggunakan Q-Q plot dan uji statistik pada residu e yang dirancang untuk menguji apakah e ~ N ( 0 , σ 2 saya ) untuk beberapa σ 2R .

εN(0,σ2I)e^=(IH)YN(0,(IH)σ2)
e^1,,e^nεN(0,σ2I)e^e^N(0,σ2I)σ2R

Kenapa tidak penting untuk tes ini bahwa residu berkorelasi, dan tidak independen? Hal ini sering disarankan untuk menggunakan standar tetapi itu hanya membuat mereka homoseks, tidak mandiri.

e^i=e^i1hii,

Untuk mengulangi pertanyaan: Residu dari regresi OLS berkorelasi. Saya mengerti bahwa dalam praktiknya, korelasi ini sangat kecil (sebagian besar waktu? Selalu?), Mereka dapat diabaikan ketika menguji apakah residu berasal dari distribusi normal. Pertanyaan saya adalah, mengapa?

Zoran Loncarevic
sumber
1
Menjadikan mereka homoseksual.
Scortchi
1
Apakah Anda bertanya tentang penerapan tes ini ketika residu memiliki korelasi kuat atau Anda hanya khawatir tentang korelasi negatif (sangat kecil dan tidak penting) yang timbul dari prosedur estimasi kuadrat terkecil?
whuber
1
@whuber saya bertanya tentang korelasi yang timbul dari prosedur estimasi kuadrat terkecil. Jika mereka sedikit dan tidak penting, saya ingin tahu mengapa.
Zoran Loncarevic

Jawaban:

3

HXM:=InH

XRn×ke^Rn

εXεspan(X)y=Xβ+ε=y~+εy~εy~=Xβspan(X)yε

b1,,bnRnb1,,bkspan(X)bk+1,,bnspan(X)ε=α1b1++αnbnαii{1,,k}Xβspan(X)

εe^ne^RneRnk

eNnk(0,σ2Ink),
ee

Dalam makalah singkat Pada Pengujian Gangguan Regresi untuk Normalitas Anda menemukan perbandingan residu OLS dan BLUS. Dalam pengaturan Monte Carlo yang diuji, residu OLS lebih unggul daripada residu BLUS. Tetapi ini harus memberi Anda beberapa titik awal.

Marco Breitig
sumber