Saya memiliki regresi linier yang cukup bagus, saya kira (ini untuk proyek universitas jadi saya tidak benar-benar harus super akurat).
Intinya adalah, jika saya memplot residu vs nilai prediksi, ada (menurut guru saya) sedikit heteroskedastisitas.
Tetapi jika saya memplot QQ-Plot dari residu, jelas bahwa mereka terdistribusi secara normal. Selain itu, tes Shapiro pada residual memiliki -nilai dari , jadi saya pikir tidak ada keraguan residual sebenarnya terdistribusi secara normal.
Pertanyaan: Bagaimana bisa ada heteroskedastisitas pada nilai prediksi jika residu terdistribusi secara normal?
ncvTest
fungsi dari paket mobil untukR
melakukan tes formal untuk heteroskedastisitas. Dalam contoh whuber, perintahncvTest(fit)
menghasilkan nilai- yang hampir nol dan memberikan bukti kuat terhadap varians kesalahan konstan (yang diharapkan, tentu saja).Jawaban:
Salah satu cara untuk mendekati pertanyaan ini adalah dengan melihatnya secara terbalik: bagaimana kita bisa mulai dengan residu terdistribusi normal dan mengaturnya menjadi heteroskedastik? Dari sudut pandang ini jawabannya menjadi jelas: kaitkan residu yang lebih kecil dengan nilai prediksi yang lebih kecil.
Sebagai ilustrasi, berikut adalah konstruksi eksplisit.
Data di sebelah kiri jelas heteroscedastic relatif terhadap kecocokan linear (ditunjukkan dalam warna merah). Ini didorong pulang oleh residual vs prediksi plot di sebelah kanan. Tetapi - dengan konstruksi - kumpulan residu yang tidak berurutan mendekati terdistribusi secara normal, sebagaimana ditunjukkan oleh histogram mereka di tengah. (Nilai p dalam uji normalitas Shapiro-Wilk adalah 0,60, diperoleh dengan
R
perintah yangshapiro.test(residuals(fit))
dikeluarkan setelah menjalankan kode di bawah ini.)Data nyata dapat terlihat seperti ini juga. Moral adalah bahwa heteroskedastisitas mencirikan hubungan antara ukuran residu dan prediksi sedangkan normalitas tidak memberi tahu kita tentang bagaimana residu berhubungan dengan hal lain.
Ini adalah
R
kode untuk konstruksi ini.sumber
Dalam regresi kuadrat terkecil (WLS), itu adalah faktor acak dari perkiraan residu yang mungkin ingin Anda lihat terdistribusi secara normal, meskipun sering kali tidak terlalu penting. Perkiraan residual dapat diperhitungkan, seperti yang ditunjukkan dalam kasus regresi sederhana (satu regresi dan melalui asal), di bagian bawah halaman 1, dan bagian bawah halaman 2 dan 7 di https://www.researchgate.net/publication / 263036348_Properties_of_Weighted_Least_Squares_Regression_for_Cutoff_Sampling_in_Establishment_Surveys Anyway, ini mungkin membantu menunjukkan di mana normalitas dapat muncul dalam gambar.
sumber