Kesalahan standar adalah estimasi standar deviasi dari estimator untuk parameter . θ θ
Mengapa estimasi standar deviasi residual disebut "residual standard error" (misalnya, dalam output summary.lm
fungsi R ) dan bukan "standar deviasi residual"? Perkiraan parameter apa yang kami lengkapi dengan kesalahan standar di sini?
Apakah kita menganggap setiap residu sebagai penaksir untuk istilah kesalahan "nya" dan memperkirakan kesalahan standar "gabungan" dari semua penaksir ini?
r
standard-error
residuals
terminology
Michael M.
sumber
sumber
Jawaban:
Saya pikir ungkapan itu khusus untuk
summary.lm()
keluaran R. Perhatikan bahwa nilai yang mendasarinya sebenarnya disebut "sigma" (summary.lm()$sigma
). Saya tidak berpikir perangkat lunak lain perlu menggunakan nama itu untuk standar deviasi residu. Sebagai tambahan, ungkapan 'standar deviasi residu' adalah umum di buku pelajaran, misalnya. Saya tidak tahu bagaimana itu bisa menjadi ungkapan yang digunakan dalamsummary.lm()
output R , tapi saya selalu berpikir itu aneh.sumber
summary.lm(reg)$sigma
bedanyasd(reg$residuals)
?stats::sigma
: Keliru "Residual standard error" telah menjadi bagian dari terlalu banyak output R (dan S) yang mudah diubah di sana.Dari pelatihan ekonometrik saya, ini disebut "residual standard error" karena ini merupakan perkiraan dari "standar deviasi residual" yang sebenarnya. Lihat pertanyaan terkait ini yang menguatkan istilah ini.
Pencarian Google untuk istilah standard error residual juga menunjukkan banyak hit, jadi itu sama sekali bukan keanehan R. Saya mencoba kedua istilah dengan kutipan, dan keduanya muncul sekitar 60.000 kali.
sumber
Kesalahan standar - Wikipedia, ensiklopedia gratis
sumber
Model regresi yang sesuai menggunakan parameter untuk menghasilkan prediksi estimasi titik yang merupakan sarana respon yang diamati jika Anda mereplikasi studi dengan nilai-nilai XX yang sama beberapa kali ( ketika model linier benar ).
Perbedaan antara nilai-nilai prediksi dan yang digunakan agar sesuai dengan model disebut " Residual " yang, ketika mereplikasi proses pengumpulan data, memiliki sifat variabel acak dengan 0 berarti. Residu yang diamati kemudian digunakan untuk selanjutnya memperkirakan variabilitas dalam nilai-nilai ini dan untuk memperkirakan distribusi sampling dari parameter.
catatan:
Ketika standar kesalahan residual tepat 0 maka model cocok dengan data dengan sempurna (kemungkinan karena overfitting).
Jika kesalahan standar residual tidak dapat ditunjukkan secara signifikan berbeda dari variabilitas dalam respon tanpa syarat, maka ada sedikit bukti yang menunjukkan bahwa model linier memiliki kemampuan prediksi.
sumber