Melihat definisi Wikipedia tentang:
- Mean Squared Error (MSE)
- Jumlah Sisa Kuadrat (RSS)
Sepertinya saya itu
di mana adalah jumlah sampel dan adalah estimasi kami untuk .
Namun, tidak ada artikel Wikipedia yang menyebutkan hubungan ini. Mengapa? Apakah saya melewatkan sesuatu?
Jawaban:
Sebenarnya itu disebutkan di bagian Regresi kesalahan kuadrat Mean di Wikipedia:
Anda juga dapat menemukan beberapa informasi di sini: Kesalahan dan residu dalam statistik Dikatakan bahwa ekspresi kuadrat kesalahan mungkin memiliki arti yang berbeda dalam kasus yang berbeda, yang kadang-kadang rumit.
sumber
Namun perlu diperhatikan bahwa Sum of Squared Erros (SSE) dan Residue Sum of Squares (RSS) terkadang digunakan secara dapat dipertukarkan, sehingga membingungkan pembaca. Misalnya, periksa Url ini: https://365datascience.com/sum-squares/ untuk informasi lebih lanjut tentang regresi linier.
Sebenarnya dari sudut pandang statistik, Kesalahan dan Residu adalah konsep yang sama sekali berbeda. Kesalahan terutama merujuk pada perbedaan antara nilai sampel aktual yang diamati dan nilai prediksi Anda, dan sebagian besar digunakan dalam metrik statistik seperti Root Means Squared Errors (RMSE) dan Mean Absollute Errors (MAE). Sebaliknya, residu merujuk secara eksklusif pada perbedaan antara variabel dependen dan estimasi dari regresi linier.
sumber
Saya rasa ini tidak benar di sini jika kita menganggap MSE sebagai sqaure dari RMSE. Misalnya, Anda memiliki serangkaian data sampel pada prediksi dan pengamatan, sekarang Anda mencoba melakukan regresi linier: Pengamatan (O) = a + b X Prediksi (P). Dalam hal ini, MSE adalah jumlah perbedaan kuadrat antara O dan P dan dibagi dengan ukuran sampel N.
Tetapi jika Anda ingin mengukur kinerja regresi linier, Anda perlu menghitung Mean Squared Residue (MSR). Dalam kasus yang sama, pertama-tama akan menghitung Residual Sum of Squares (RSS) yang sesuai dengan jumlah perbedaan kuadrat antara nilai observasi aktual dan observasi yang diprediksi berasal dari regresi linier. Kemudian, diikuti oleh RSS dibagi dengan N-2 hingga dapatkan MSR.
Sederhananya, dalam contoh, MSE tidak dapat diperkirakan menggunakan RSS / N karena komponen RSS tidak lagi sama dengan komponen yang digunakan untuk menghitung MSE.
sumber