Over-fitting jaringan saraf

9

Saya telah belajar bahwa over-fitting dapat dideteksi dengan merencanakan kesalahan pelatihan dan kesalahan pengujian versus zaman. Seperti di:

masukkan deskripsi gambar di sini

Saya telah membaca posting blog ini di mana mereka mengatakan jaringan saraf, net5 terlalu pas dan mereka memberikan angka ini:

masukkan deskripsi gambar di sini

Yang aneh bagi saya, karena kesalahan validasi dan pelatihan dari net5 terus menurun (tapi lambat).

Mengapa mereka mengklaim itu terlalu pas? Apakah karena kesalahan validasi mandek?

Olivier_s_j
sumber

Jawaban:

10

Overfitting tidak hanya ketika kesalahan pengujian meningkat seiring iterasi. Kami mengatakan bahwa ada overfitting ketika kinerja di set tes jauh lebih rendah daripada kinerja di set kereta api (karena modelnya terlalu banyak cocok untuk data yang terlihat, dan tidak menggeneralisasi dengan baik).

Dalam plot kedua Anda, kita dapat melihat bahwa pertunjukan di set tes hampir 10 kali lebih rendah dari kinerja di set kereta, yang dapat dianggap sebagai overfitting.

Hampir selalu merupakan kasus bahwa sebuah model berkinerja lebih baik di set pelatihan daripada set tes, karena model sudah melihat data. Namun, model yang baik harus bisa menggeneralisasi data yang tidak terlihat dengan baik, dan kemudian mengurangi kesenjangan antara kinerja di kereta dan set tes.

Contoh overfitting pertama Anda dapat dipecahkan dengan menghentikan lebih awal misalnya. Contoh kedua Anda dapat diselesaikan dengan regularisasi, dengan merusak input, dll.

jpl
sumber
Mengapa Overfitting buruk dalam kasus itu? Kita dapat melihatnya berkinerja lebih baik pada set tes sehingga menyamaratakan dengan lebih baik bukan?
Fractale
1
@Fractale Ada banyak aspek lain yang perlu dipertimbangkan di luar langkah pelatihan. Sebagai contoh, serangkaian hyperparameter lain dapat menghasilkan kesalahan pengujian yang lebih baik dan kesalahan pelatihan yang lebih buruk (regularisasi yang lebih kuat). Oleh karena itu, konfigurasi seperti itu akan menghasilkan lebih sedikit overfitting. "Over" -cocokan selalu menyiratkan perbandingan. Mengubah sesuatu sedemikian rupa sehingga menghasilkan kesalahan pelatihan yang jauh lebih baik tetapi kesalahan pengujian yang lebih buruk atau tidak secara signifikan lebih baik dari contoh pelatihan, dibandingkan dengan pengaturan aslinya. "Perubahan" dapat berupa apa saja: jumlah iterasi pelatihan, hiperparam, dll.
isarandi