Apa perbedaan antara kesalahan dan residu?

20

Sementara dua istilah ini di mana-mana sering digunakan secara sinonim, kadang-kadang tampaknya ada perbedaan. Apakah memang ada perbedaan, atau mereka persis sama?

Konstantin
sumber
Lihat Qin & Gilbert "Istilah Kesalahan dalam Sejarah Time Series Econometrics" untuk perawatan komprehensif jika Anda punya waktu. Oh, tapi ini hanya untuk data deret waktu.
Richard Hardy

Jawaban:

20

Kesalahan berkaitan dengan proses pembuatan data yang sebenarnya (DGP), sedangkan residu adalah apa yang tersisa setelah memperkirakan model Anda. Sebenarnya, asumsi seperti normalitas, homoseksualitas, dan independensi berlaku untuk kesalahan DGP, bukan residual model Anda. (Misalnya, memilikiparametersesuaidalam model Anda, hanyaresidudapat independen.) Namun, kami hanya memiliki akses ke residual, sehingga kami bekerja dengannya. hal+1N-(hal+1)

gung - Reinstate Monica
sumber
9
(+1) Residual dapat dianggap sebagai estimasi kesalahan.
Scortchi
@ABC, DGPsingkatan dari proses menghasilkan data . Bahkan jika model Anda sesuai & mencerminkan struktur DGP yang sebenarnya, residu tidak harus normal, homoseksual & independen jika kesalahan yang mendasarinya tidak.
gung - Reinstate Monica
@ Scortchi Hai, apakah Anda memiliki referensi yang memperluas komentar Anda? Saya mencoba memahami mengapa residual dapat digunakan sebagai perkiraan kesalahan, karena saya melihat orang memeriksa normalitas residu dalam analisis regresi ketika asumsi aktual adalah normalitas kesalahan, dan saya tidak tahu persis mengapa itu valid.
Austin
@Austin, jika Anda masih tertarik dengan itu, Anda harus mengajukan pertanyaan baru.
gung - Reinstate Monica
13

Sebuah kesalahan adalah perbedaan antara nilai yang diamati dan nilai sebenarnya (sangat sering tidak teramati, yang dihasilkan oleh DGP).

Sebuah residual adalah perbedaan antara nilai yang diamati dan nilai prediksi (oleh model).

Leopold W.
sumber
Menanggapi kesalahan yang "sangat sering tidak teramati", pada kenyataannya kita tidak pernah bisa mengamati nilai mutlak absolut. Setiap perangkat pengukuran memiliki kesalahan hingga yang melekat pada perangkat pengukuran. Yang terbaik yang dapat Anda klaim adalah bahwa nilai sebenarnya pada suatu titik sama dengan apa pun yang diukur plus / minus kesalahan pengamatan, atau kesalahan pengukuran, misalnya, penggaris saya dapat menambah jarak hingga 1 mm, sehingga yang terbaik yang bisa saya ukur adalah panjang sebenarnya pensil dalam 0,1mm. Perhatikan bahwa ini berbeda dari kesalahan sistematis apa pun, misalnya, penggaris saya entah bagaimana direntangkan selama pembuatan dan pengukuran terlalu lama. ±
Steven C. Howell
Tautan ini ( ece.rochester.edu/courses/ECE111/error_uncertainty.pdf ) memberikan penjelasan yang baik dengan referensi ke teks Bevington dan Taylor tentang masalah ini.
Steven C. Howell
Dalam bahasa pembelajaran mesin, apakah residu kesalahan pelatihan dan kesalahan adalah kesalahan pengujian?
Charles Chow
@CharlesChow Tergantung pada dataset yang Anda gunakan. Jika Anda menggunakan set pelatihan, maka itu adalah kesalahan pelatihan; jika Anda menggunakan set tes, maka itu adalah test error.
Leopold W.
7

Istilah kesalahan adalah konsep teoretis yang tidak pernah dapat diamati, tetapi residual adalah nilai dunia nyata yang dihitung untuk setiap kali regresi dilakukan

Kudzai Lemiel Munyukwa
sumber