Bisakah RMSE dan MAE memiliki nilai yang sama?

9

Saya menerapkan validasi silang dan penghitungan metrik kesalahan seperti RMSE, , MAE, MSE, dll.R2

Bisakah RMSE dan MAE memiliki nilai yang sama?

Perl
sumber
1
Iya. Kenapa tidak? Biarkan X selalu 0 dan prediktor untuk X selalu 1 . Itu dia
David

Jawaban:

17

Ya, secara teori. Kasus paling sederhana yang dapat saya bayangkan adalah dataset di mana semua kesalahan prediksi (yaitu residual) tepat ± 1. RMSE dan MAE akan mengembalikan nilai-nilai identik dari 1. Seseorang dapat membangun skenario lain juga, tetapi tidak ada yang tampaknya sangat mungkin.

EDIT: Terima kasih kepada @DilipSarwate untuk menunjukkan (dijabarkan lebih lanjut oleh @ user20160 dalam jawaban mereka yang sangat baik) bahwa hasil ini dimungkinkan jika dan hanya jika nilai absolut dari semua kesalahan prediksi identik. Tidak ada yang istimewa tentang nilai ± 1 dalam contoh saya, dengan kata lain; nomor lainnya akan berfungsi sebagai ganti 1.

mkt - Pasang kembali Monica
sumber
1
Bisakah Anda memberikan contoh skenario lain yang Anda impikan? Maksud saya contoh selain kelipatan skalar (ketika semua residual adalah bukannya ± 1 ) dari contoh di atas. ±σ±1
Dilip Sarwate
@DilipSarwate Saya sedang merenungkan ini ketika user20160 menambahkan jawaban yang jauh lebih baik yang membahasnya lebih detail daripada yang saya bisa.
mkt - Reinstate Monica
1
@ mkt Terima kasih atas kata-kata baiknya. Jawaban Anda benar dan singkat (+1)
user20160
@DilipSarwate Terima kasih atas inputnya
mkt - Reinstate Monica
1
Beberapa hiasan tambahan untuk jawaban Anda: (i) harus genap (katakan n = 2 k ) dan (ii) persis k residual harus memiliki nilai + σ dan persis k residual harus memiliki nilai - σ , yang tentu saja berarti bahwa semua residu memiliki nilai absolut σ seperti yang Anda nyatakan, tetapi (ii) memastikan bahwa residual berjumlah 0 sebagaimana mestinya, Sisa adalah penyimpangan dari rata-rata dan karenanya harus berjumlah nol. nn=2kk+σkσσ0
Dilip Sarwate
23

Mean absolute error (MAE) dapat sama dengan mean squared error (MSE) atau root mean squared error (RMSE) dalam kondisi tertentu, yang akan saya tunjukkan di bawah ini. Kondisi ini tidak mungkin terjadi dalam praktik.

Persiapan

Biarkan ri=|yiy^i|menunjukkan nilai absolut residu untuk titik data ke- i , dan misalkan r=[ri,,rn]T menjadi vektor yang mengandung residu absolut untuk semua n titik dalam dataset. Membiarkan 1 menunjukkan vektor n×1 , MAE, MSE, dan RMSE dapat ditulis sebagai:

(1)MAE=1n1TrMSE=1nrTrRMSE=1nrTr

MSE

Mengatur MSE sama dengan MAE dan mengatur ulang memberikan:

(2)(r1)Tr=0

MSE dan MAE adalah sama untuk semua dataset di mana residu absolut menyelesaikan persamaan di atas. Dua solusi yang jelas adalah: r=0 (tidak ada kesalahan) dan r=1 (semua residualnya ±1 , seperti yang disebutkan mkt). Tapi, ada banyak solusi tak terhingga.

(2)r1r

(2)

(3)(r121)T(r121)=n4

n[12,,12]T12n

RMSE

Menyetel RMSE sama dengan MAE dan mengatur ulang memberi:

(4)rTAr=0

A=(nI11T)

IArAr=0An×nn11Ar=0

(5)(n1)rijirj=0i

Atau, menata ulang hal-hal:

(6)ri=1n1jirji

riA

{rr=c1c0}

Jadi, RMSE dan MAE sama jika dan hanya jika nilai absolut dari residual sama untuk semua titik data.

pengguna20160
sumber
1
r
1
Sebenarnya, pertanyaannya adalah apakah RMSE dan MAE bisa sama dan bukan apakah MSE dan MAE bisa sama. Mungkin jawaban @ mkt (atau versi umum daripadanya yang saya sarankan dalam komentar) adalah satu-satunya jawaban untuk pertanyaan RMSE = MAE?
Dilip Sarwate
@DilipSarwate, Ya, menyadari setelah memposting ini bahwa saya telah melewatkan bagian 'R'. Saya telah diedit untuk memasukkan RMSE sekarang. Saya percaya versi yang Anda sarankan adalah satu-satunya jawaban yang mungkin dalam kasus ini.
user20160
@whuber Itu poin bagus. Saya akan mencoba mengedit sesuatu seperti ini.
user20160
2
@ Hiyam Jika hanya ada 1 nilai, maka RMSE menurut definisi harus sama dengan MAE. Karena hanya ada 1 kesalahan, mengkuadratkan dan mengambil root hanya mengembalikan nilai absolut dari kesalahan asli.
mkt - Pasang kembali Monica