Ketika (yaitu, Y berasal dari model regresi linier), ε ∼ N ( 0 , σ 2 I ) Dan dalam kasus residu e 1 , ... , e n berkorelasi dan tidak independen. Tetapi ketika kita melakukan diagnosa regresi dan ingin menguji asumsi ε ~ N ( 0 , σ 2 I ) , setiap buku teks menyarankan untuk menggunakan Q-Q plot dan uji statistik pada residu e yang dirancang untuk menguji apakah e ~ N ( 0 , σ 2 saya ) untuk beberapa σ 2 ∈ R .
Kenapa tidak penting untuk tes ini bahwa residu berkorelasi, dan tidak independen? Hal ini sering disarankan untuk menggunakan standar tetapi itu hanya membuat mereka homoseks, tidak mandiri.
Untuk mengulangi pertanyaan: Residu dari regresi OLS berkorelasi. Saya mengerti bahwa dalam praktiknya, korelasi ini sangat kecil (sebagian besar waktu? Selalu?), Mereka dapat diabaikan ketika menguji apakah residu berasal dari distribusi normal. Pertanyaan saya adalah, mengapa?
sumber
Jawaban:
Dalam makalah singkat Pada Pengujian Gangguan Regresi untuk Normalitas Anda menemukan perbandingan residu OLS dan BLUS. Dalam pengaturan Monte Carlo yang diuji, residu OLS lebih unggul daripada residu BLUS. Tetapi ini harus memberi Anda beberapa titik awal.
sumber