Ketika menjalankan model regresi berganda dalam R, salah satu outputnya adalah kesalahan standar residual 0,0589 pada 95,161 derajat kebebasan. Saya tahu bahwa 95,161 derajat kebebasan diberikan oleh perbedaan antara jumlah pengamatan dalam sampel saya dan jumlah variabel dalam model saya. Apa kesalahan standar residual?
regression
standard-error
residuals
ustroetz
sumber
sumber
Jawaban:
Model regresi yang sesuai menggunakan parameter untuk menghasilkan prediksi estimasi titik yang merupakan sarana respon yang diamati jika Anda mereplikasi penelitian dengan nilai sama beberapa kali (dan ketika model linier itu benar). Perbedaan antara nilai-nilai prediksi dan yang digunakan agar sesuai dengan model disebut "residual" yang, ketika mereplikasi proses pengumpulan data, memiliki sifat variabel acak dengan 0 berarti.X
Residu yang diamati kemudian digunakan untuk selanjutnya memperkirakan variabilitas dalam nilai-nilai ini dan untuk memperkirakan distribusi sampling dari parameter. Ketika standar kesalahan residual adalah tepat 0 maka model cocok dengan data dengan sempurna (kemungkinan karena overfitting). Jika kesalahan standar residual tidak dapat ditunjukkan secara signifikan berbeda dari variabilitas dalam respon tanpa syarat, maka ada sedikit bukti yang menunjukkan bahwa model linier memiliki kemampuan prediksi.
sumber
Katakanlah kita memiliki tabel ANOVA berikut (diadaptasi dari
example(aov)
perintah R ):Jika Anda membagi jumlah kuadrat dari sumber variasi (model atau residu) dengan derajat kebebasan masing-masing, Anda mendapatkan kuadrat rata-rata. Khusus untuk residu:
Jadi 76,57 adalah kuadrat rata-rata dari residual, yaitu jumlah variasi residual (setelah menerapkan model) pada variabel respons Anda.
sumber
RSE dijelaskan dengan cukup jelas dalam "Pengantar Pembelajaran Statistik".
sumber