Ini terlihat seperti pertanyaan serupa dan tidak mendapat banyak tanggapan.
Menghilangkan tes seperti Cook's D, dan hanya melihat residu sebagai suatu kelompok, saya tertarik pada bagaimana orang lain menggunakan residu ketika menilai good-of-fit. Saya menggunakan residu mentah:
- dalam plot QQ, untuk menilai normalitas
- dalam sebaran versus residual, untuk pemeriksaan bola mata dari (a) hetereoscedasticity dan (b) autokorelasi serial.
Untuk memplot versus residual untuk memeriksa nilai mana outlier dapat terjadi, saya lebih suka menggunakan residual yang telah di pelajarkan . Alasan untuk preferensi saya adalah bahwa ini memungkinkan penglihatan yang mudah dari residu mana yang nilai- bermasalah, meskipun residu terstandarisasi memberikan hasil yang sangat mirip. Teori saya tentang mana yang digunakan adalah bahwa itu tergantung pada universitas mana seseorang pergi.
Apakah ini mirip dengan cara orang lain menggunakan residu? Apakah orang lain menggunakan jumlah grafik ini dalam kombinasi dengan statistik ringkasan?
sumber
Jawaban:
Ini bukan jawaban yang terlalu banyak sebagai klarifikasi tentang terminologi. Pertanyaan Anda bertanya tentang residu mentah, terstandar, dan terpelajar. Namun, ini bukan terminologi yang digunakan oleh sebagian besar ahli statistik, meskipun saya perhatikan catatan kelas Anda menyatakan itu.
Raw: sama seperti yang Anda miliki.
Terstandar: ini sebenarnya residu mentah dibagi dengan standar deviasi residu yang sebenarnya. Karena standar deviasi yang sebenarnya jarang diketahui, residu standar hampir tidak pernah digunakan.
Internalally Studentized: karena deviasi standar sebenarnya dari residu biasanya tidak diketahui, estimasi deviasi standar digunakan sebagai gantinya. Ini adalah residual antar siswa, dan inilah yang Anda sebut standar.
Studentized Eksternal: sama dengan residual mahasiswa internal, kecuali bahwa perkiraan standar deviasi residu dihitung dari regresi meninggalkan pengamatan yang bersangkutan.
Pearson: residu mentah dibagi dengan standar deviasi dari variabel respon (variabel y) daripada residual. Anda tidak memiliki yang ini terdaftar.
"tinggalkan satu": Tidak memiliki nama resmi, tetapi sama dengan catatan kelas.
standarisasi "tinggalkan satu": juga tidak memiliki nama resmi, tetapi ini bukan apa yang disebut catatan kelas siswa.
Sumber:
tautan wiki yang sama dengan yang Anda miliki tentang residu pelajar ("residu pelajar adalah hasil bagi dari pembagian residu dengan perkiraan standar deviasi")
dokumentasi untuk perhitungan residu dalam SAS
sumber
Re: plot,
Ada yang namanya overfitting, tetapi overplotting tidak bisa berbuat banyak, terutama pada tahap diagnosa. Plot probabilitas normal standar tidak ada salahnya di sebelah plot QQ Anda. Saya merasa lebih baik menilai bagian tengah distribusi.
Re: residu,
Saya menjalankan residual terstandarisasi dan mahasiswa pada tahap konsep dan biasanya berakhir dengan pengkodean yang terstandarisasi. Saya tidak tahu apa yang sebenarnya dijalankan orang lain, karena diagnostik benar-benar dikodekan dalam materi replikasi yang saya temukan online.
Re: diagnostik,
vif
hettest
sumber