Apa itu kesalahan standar residual?

35

Ketika menjalankan model regresi berganda dalam R, salah satu outputnya adalah kesalahan standar residual 0,0589 pada 95,161 derajat kebebasan. Saya tahu bahwa 95,161 derajat kebebasan diberikan oleh perbedaan antara jumlah pengamatan dalam sampel saya dan jumlah variabel dalam model saya. Apa kesalahan standar residual?

ustroetz
sumber
2
Pertanyaan ini dan jawabannya mungkin membantu: Mengapa kita mengatakan kesalahan standar residual?
Antoine Vernet
Pertanyaan singkat: Apakah "standar kesalahan residual" sama dengan "standar deviasi residual"? Gelman dan Hill (hal.41, 2007) tampaknya menggunakannya secara bergantian.
JetLag

Jawaban:

26

Model regresi yang sesuai menggunakan parameter untuk menghasilkan prediksi estimasi titik yang merupakan sarana respon yang diamati jika Anda mereplikasi penelitian dengan nilai sama beberapa kali (dan ketika model linier itu benar). Perbedaan antara nilai-nilai prediksi dan yang digunakan agar sesuai dengan model disebut "residual" yang, ketika mereplikasi proses pengumpulan data, memiliki sifat variabel acak dengan 0 berarti.X

Residu yang diamati kemudian digunakan untuk selanjutnya memperkirakan variabilitas dalam nilai-nilai ini dan untuk memperkirakan distribusi sampling dari parameter. Ketika standar kesalahan residual adalah tepat 0 maka model cocok dengan data dengan sempurna (kemungkinan karena overfitting). Jika kesalahan standar residual tidak dapat ditunjukkan secara signifikan berbeda dari variabilitas dalam respon tanpa syarat, maka ada sedikit bukti yang menunjukkan bahwa model linier memiliki kemampuan prediksi.

AdamO
sumber
3
Ini mungkin sudah dijawab sebelumnya. Lihat apakah pertanyaan ini memberikan jawaban yang Anda butuhkan. [Interpretasi dari Rm lm () output] [1] [1]: stats.stackexchange.com/questions/5135/…
doug.numbers
26

Katakanlah kita memiliki tabel ANOVA berikut (diadaptasi dari example(aov)perintah R ):

          Df Sum Sq Mean Sq F value Pr(>F)
Model      1   37.0   37.00   0.483  0.525
Residuals  4  306.3   76.57               

Jika Anda membagi jumlah kuadrat dari sumber variasi (model atau residu) dengan derajat kebebasan masing-masing, Anda mendapatkan kuadrat rata-rata. Khusus untuk residu:

306.34=76.57576.57

Jadi 76,57 adalah kuadrat rata-rata dari residual, yaitu jumlah variasi residual (setelah menerapkan model) pada variabel respons Anda.

76.57

Waldir Leoncio
sumber
1
Saya memilih-pilih jawaban dari @AdamO karena sebagai orang yang paling sering menggunakan regresi, jawaban itu paling mudah bagi saya. Namun, saya menghargai jawaban ini karena menggambarkan hubungan notasi / konseptual / metodologis antara ANOVA dan regresi linier.
svannoy
12

Y=β0+β1X+ϵ
ϵX

β0β1ϵϵ

RSE dijelaskan dengan cukup jelas dalam "Pengantar Pembelajaran Statistik".

monster kecil
sumber
2
ϵRSE=RSS(n-2)
1
Bagi siapa pun yang membaca epub ISL, Anda dapat menemukan "halaman 66" dengan ctrl-f "kesalahan standar residual." (File Epub tidak memiliki nomor halaman sebenarnya).
user2426679