Saya mengevaluasi model fisik dan ingin tahu mana salah satu metode yang harus saya gunakan di sini (antara RMSE dan Koefisien Determinasi R2)
Masalahnya adalah sebagai berikut: Saya memiliki fungsi yang menghasilkan prediksi untuk nilai input x, . Saya juga memiliki observasi aktual untuk nilai yang saya sebut .yx
Pertanyaan saya adalah apa pro dan kontra dari RMSE atau . Saya telah melihat keduanya digunakan di kertas untuk masalah yang sedang saya kerjakan.
This value shows how well future outcomes can be predicted by the model
- ini sangat menyesatkan dan condong ke arah yang salah . Tidak ada jaminan bahwa koefisien determinasi yang tinggi dalam model yang diberikan berkaitan dengan seberapa baik hasil di masa mendatang akan diprediksi.Apa pun pengukuran Errror yang Anda berikan, pertimbangkan untuk memberikan vektor hasil lengkap Anda dalam lampiran. Orang yang suka membandingkan dengan metode Anda tetapi lebih suka pengukuran kesalahan lain dapat memperoleh nilai seperti itu dari tabel Anda.
Tidak mencerminkan kesalahan sistematis. Bayangkan Anda mengukur diameter bukan jari-jari benda melingkar. Anda memiliki perkiraan terlalu tinggi sebesar 100%, tetapi masih bisa mencapai mendekati 1.R2
Tidak setuju dengan komentar sebelumnya bahwa sulit dimengerti. Semakin tinggi nilainya, semakin tepat model Anda, tetapi ini dapat mencakup kesalahan sistematis.R2
Dapat diungkapkan dengan rumus yang mudah dipahami di mana Anda membangun rasio jumlah residu kuadrat dan membaginya dengan rata-rata:
Anda dapat mencapai rendah hanya dengan memiliki kedua presisi tinggi (outlier tunggal tetapi besar menghukum berat) dan tidak ada kesalahan sistematis. Jadi dengan cara rendah menghasilkan kualitas yang lebih baik daripada tinggi .R M S E R 2R MSE R MSE R2
Nomor ini memiliki satu unit dan bagi orang yang tidak terbiasa dengan data Anda tidak mudah untuk menafsirkannya. Misalnya dapat dibedakan dengan rata-rata data untuk menghasilkan . Hati-hati, ini bukan satu-satunya definisi . Beberapa orang lebih suka membagi dengan rentang data mereka daripada membaginya dengan rata-rata.r e l . R M S Er e l . R MSE r e l . R MSE
Seperti yang disebutkan orang lain, pilihannya mungkin tergantung pada bidang dan keadaan Anda. Apakah ada metode yang sangat diterima untuk membandingkan juga? Gunakan pengukuran yang sama seperti yang mereka lakukan dan Anda dapat langsung menghubungkan manfaat metode Anda dengan mudah dalam diskusi.
sumber
Kedua akar-mean-Square-Kesalahan (RMSE) dan koefisien determinasi ( )R2 menawarkan yang berbeda, namun saling melengkapi, informasi yang harus dinilai ketika mengevaluasi model yang fisik Anda. Tidak ada yang "lebih baik", tetapi beberapa laporan mungkin lebih fokus pada satu metrik tergantung pada aplikasi tertentu.
Saya akan menggunakan yang berikut ini sebagai panduan yang sangat umum untuk memahami perbedaan antara kedua metrik:
The RMSE memberi Anda rasa seberapa dekat (atau jauh) nilai-nilai Anda diprediksi berasal dari data aktual Anda sedang berusaha untuk Model. Ini berguna dalam berbagai aplikasi di mana Anda ingin memahami keakuratan dan ketepatan prediksi model Anda (misalnya, memodelkan tinggi pohon).
Pro
Cons
Pro
Cons
Tentu saja, di atas akan tunduk pada ukuran sampel dan desain pengambilan sampel, dan pemahaman umum bahwa korelasi tidak menyiratkan sebab-akibat.
sumber
Ada juga MAE, Mean Absolute Error. Tidak seperti RMSE, itu tidak terlalu sensitif terhadap kesalahan besar. Dari apa yang saya baca, beberapa bidang lebih suka RMSE, yang lain MAE. Saya suka menggunakan keduanya.
sumber
Sebenarnya, bagi para ilmuwan statistik harus mengetahui model yang paling cocok, maka RMSE sangat penting bagi orang-orang dalam penelitiannya yang kuat. Jika RMSE sangat mendekati nol, maka model tersebut paling cocok.
Koefisien determinasi baik untuk ilmuwan lain seperti pertanian dan bidang lainnya. Ini adalah nilai antara 0 dan 1. Jika 1, 100% nilai cocok dengan set data yang diamati. Jika 0, maka data benar-benar heterogen. Dr.SK.Khadar Babu, Universitas VIT, Vellore, TamilNadu, India.
sumber
Jika beberapa angka ditambahkan ke setiap elemen dari salah satu vektor, RMSE berubah. Sama jika semua elemen dalam satu atau kedua vektor dikalikan dengan angka. Kode R mengikuti;
sumber
Pada akhirnya perbedaannya hanyalah standardisasi karena keduanya mengarah pada pilihan model yang sama, karena RMSE dikalikan jumlah pengamatan dalam pembilang atau R kuadrat, dan penyebut yang terakhir adalah konstan di semua model (hanya plot satu ukuran terhadap lain untuk 10 model berbeda).
sumber