Saya tidak begitu mengerti heteroskedastisitas. Saya ingin tahu apakah model saya sesuai atau tidak sesuai dengan plot ini.
r
regression
residuals
heteroscedasticity
independence
kanbhold
sumber
sumber
Jawaban:
Seperti yang dikomentari @IrishStat, Anda perlu memeriksa nilai yang Anda amati terhadap kesalahan Anda untuk melihat apakah ada masalah dengan variabilitas. Saya akan kembali ke sini menjelang akhir.
begitu benar, bagaimana model saya berperilaku:
yang seharusnya memberi Anda sesuatu seperti ini: yang berarti bahwa residu Anda tampaknya tidak memiliki tren yang jelas berdasarkan indeks sewenang-wenang Anda (plot 1 - paling tidak informatif benar-benar), tampaknya tidak memiliki korelasi nyata di antara mereka (plot 2 - cukup penting dan mungkin lebih penting daripada homoskedastisitas) dan bahwa nilai yang dipasang tidak memiliki kecenderungan kegagalan yang jelas, yaitu. nilai pas Anda vs residu Anda tampak cukup acak. Berdasarkan ini kita akan mengatakan bahwa kita tidak memiliki masalah heteroskedastisitas karena residu kita tampaknya memiliki varian yang sama di mana-mana.
OK, Anda ingin heteroskedastisitas. Dengan asumsi yang sama tentang linearitas dan aditivitas, mari kita definisikan model generatif lain dengan masalah heteroskedastisitas yang "jelas". Yaitu setelah beberapa nilai pengamatan kami akan jauh lebih berisik.
di mana plot diagnostik sederhana dari model:
harus memberikan sesuatu seperti: Di sini plot pertama tampaknya agak "aneh"; kelihatannya kita memiliki beberapa residu yang mengelompok dalam besaran kecil tetapi itu tidak selalu menjadi masalah ... Plot kedua adalah OK, berarti kita tidak memiliki korelasi antara residu Anda dalam kelambatan yang berbeda sehingga kita dapat bernafas sejenak. Dan plot ketiga menumpahkan biji: sangat jelas bahwa ketika kita sampai pada nilai yang lebih tinggi, residu kita meledak. Kami pasti memiliki heteroskedastisitas dalam residual model ini dan kami perlu melakukan sesuatu tentang (mis. IRLS , regresi Theil-Sen , dll.)
Di sini masalahnya benar-benar jelas, tetapi dalam kasus-kasus lain kita mungkin telah ketinggalan; untuk mengurangi peluang kami melewatkannya, plot lain yang berwawasan luas adalah yang disebutkan oleh IrishStat: Residual versus nilai yang Diamati, atau untuk masalah mainan kami:
yang seharusnya memberikan sesuatu seperti:
Dalam keadilan situasi Anda, residual Anda vs plot nilai pas tampaknya relatif OK. Memeriksa residu Anda vs nilai-nilai yang Anda amati mungkin akan membantu untuk memastikan Anda berada di sisi yang aman. (Saya tidak menyebutkan plot QQ atau semacamnya agar tidak membingungkan banyak hal, tetapi Anda mungkin ingin memeriksanya juga secara singkat.) Saya harap ini membantu dengan pemahaman Anda tentang heteroskedastisitas dan apa yang harus Anda perhatikan.
sumber
Pertanyaan Anda tampaknya tentang heteroskedastisitas (karena Anda menyebutkannya dengan nama dan menambahkan tag), tetapi pertanyaan eksplisit Anda (misalnya, dalam judul dan) mengakhiri posting Anda lebih umum, "apakah model saya sesuai atau tidak sesuai dengan ini merencanakan". Ada lebih banyak untuk menentukan apakah model tidak tepat daripada menilai heteroskedastisitas.
Saya memo data Anda menggunakan situs web ini (ht @Alexis). Perhatikan bahwa data diurutkan dalam urutan naik dari
fitted
. Berdasarkan pada regresi dan plot kiri atas, tampaknya cukup setia:Saya tidak melihat bukti heteroskedastisitas di sini. Dari kanan atas (qq-plot), tampaknya tidak ada masalah dengan asumsi normalitas.
Di sisi lain, kurva "S" pada fit lowess merah (di plot kiri atas), dan plot acf dan pacf (di bagian bawah) memang bermasalah. Di paling kiri, sebagian besar residu berada di atas garis abu-abu 0. Saat Anda bergerak ke kanan, sebagian besar residu turun di bawah 0, lalu di atas, dan kemudian di bawah lagi. Hasil dari ini adalah bahwa jika saya katakan saya melihat residu tertentu dan itu memiliki nilai negatif (tapi saya tidak memberi tahu Anda yang mana yang saya lihat), Anda bisa menebak dengan akurasi yang baik bahwa residu di dekatnya juga dinilai negatif. Dengan kata lain, residu tidak independen — mengetahui sesuatu tentang seseorang memberi Anda informasi tentang orang lain.
Selain plot, ini dapat diuji. Pendekatan sederhana adalah dengan menggunakan tes jalan :
Untuk menjawab pertanyaan eksplisit Anda: Plot Anda menunjukkan autokorelasi serial / non-independensi residu Anda. Ini berarti bahwa model Anda tidak sesuai dalam bentuknya saat ini.
sumber