Saya mencoba mengidentifikasi model terbaik untuk memprediksi harga mobil, menggunakan harga dan fitur yang tersedia di situs iklan baris mobil.
Untuk ini saya menggunakan beberapa model dari perpustakaan scikit-belajar dan model jaringan saraf dari pybrain dan neurolab. Pendekatan yang saya gunakan sejauh ini adalah menjalankan jumlah data tetap melalui beberapa model (algoritma pembelajaran mesin) dan membandingkan nilai yang dihitung dengan modul metrik scikit-learning.
- Apakah metode yang baik untuk membandingkan kinerja model yang berbeda?
- Walaupun saya mendapatkan hasil yang cukup dapat diterima untuk model seperti jaring jaring dan hutan acak saya mendapat nilai sangat buruk untuk model jaringan saraf, jadi apakah metode yang tepat untuk mengevaluasi jaringan saraf (atau metode non-linear)?R 2
Jawaban:
Saya pikir bagian penting untuk dipertimbangkan dalam menjawab pertanyaan Anda adalah
karena pernyataan ini menyiratkan sesuatu tentang mengapa Anda ingin menggunakan model. Pilihan model dan evaluasi harus didasarkan pada apa yang ingin Anda capai dengan nilai-nilai yang sesuai.
Pertama, mari kita rekap apa dilakukannyaR2 : Ini menghitung ukuran skala berdasarkan fungsi kerugian kuadrat, yang saya yakin Anda sudah menyadari. Untuk melihat ini, menentukan sisa untuk i th-pengamatan Anda y i dan nilai dipasang sesuai y i . Menggunakan notasi nyaman S S R : = Σ N i = 1 e 2 i , S S T : = Σesaya= ysaya- y^saya ysaya y^saya SSR : = ∑Ni = 1e2saya ,R2hanya didefinisikan sebagaiR2=1-SSR/SST.SST: = ¢Ni = 1( ysaya- y¯)2 R2 R2= 1 - SSR / SST
Kedua, mari kita lihat apa yang menggunakan untuk model pilihan / sarana evaluasiR2 . Misalkan kita memilih dari serangkaian prediksi yang dihasilkan menggunakan model M : M ∈ M , di mana M adalah kumpulan model yang dipertimbangkan (dalam contoh Anda, koleksi ini akan berisi jaringan saraf, hutan acak, jaring elastis, ...). Sejak S S T akan tetap konstan di antara semua model, jika meminimalkan R 2 Anda akan memilih persis model yang meminimalkan S S R . Dengan kata lain, Anda akan memilihY¯M. M.: M∈ M. M. SST R2 SSR yang menghasilkan kerugian kesalahan kuadrat minimal!M.∈ M.
Singkatnya, pilihan / evaluasi model tidak dapat dipertimbangkan secara independen dari tujuan model.
sumber