Mengapa R memplot residu terstandarisasi terhadap kuantil teoretis dalam plot QQ?

9

Dalam R, mengapa pengaturan default qqplot(linear model)menggunakan residu terstandarisasi pada sumbu y? Mengapa R tidak menggunakan residu "reguler"?

MarkDollar
sumber

Jawaban:

13

Ketika Anda menggunakan residu terstandarisasi, nilai residu yang diharapkan adalah nol dan variansnya adalah (kurang-lebih) satu. Ini memiliki dua manfaat:

  1. Jika Anda mengubah skala salah satu variabel Anda (misalnya, ubah kilometer ke mil), plot residual tetap tidak berubah.
  2. Dalam qqplot, residu harus terletak pada garis y = x
  3. Anda mengharapkan 95% dari sisa Anda berada di antara -1,96 dan 1,96. Ini membuatnya lebih mudah untuk menemukan outlier.
csgillespie
sumber
Bisakah Anda memberi saya referensi, bahwa 95% harus berada di antara -1,96; 1,96. Dengan kata lain, mengapa residu standar harus ? dsayaN(0,1)
MarkDollar
@ Mark: Hanya google "residu terstandarisasi" dan lihat beberapa hit pertama.
csgillespie
4

Residual teoritis dalam model linier adalah independen yang terdistribusi secara normal. Namun residu yang diamati tidak independen dan tidak memiliki varian yang sama. Jadi standarisasi residu dibagi dengan estimasi standar deviasi yang terkait dengan residu yang membuatnya lebih sama dalam variansnya (menggunakan informasi dari matriks topi untuk menghitungnya). Ini adalah residu yang lebih bermakna untuk dilihat di qqplot.

Juga, apakah Anda benar-benar menjalankan qqplot pada model yang sesuai? atau ini qqplot dari runing plot pada model?

Greg Snow
sumber
1
Hei! Saya sedang berbicara tentang qqplot dari menjalankan plot (> lm <). Terima kasih atas jawaban anda. Saya ingin memberi tanda cs, karena jawabannya lebih cepat. Saya harap itu baik-baik saja untuk Anda :)
MarkDollar