Dalam pembelajaran mesin dasar kita diajarkan "aturan praktis" berikut:
a) ukuran data Anda harus setidaknya 10 kali ukuran dimensi VC dari set hipotesis Anda.
b) jaringan saraf dengan koneksi N memiliki dimensi VC sekitar N.
Jadi ketika sebuah jaringan saraf pembelajaran yang dalam mengatakan, jutaan unit, apakah ini berarti kita harus memiliki, katakanlah, milyaran poin data? Bisakah Anda menjelaskan tentang ini?
Jawaban:
Aturan praktis yang Anda bicarakan tidak dapat diterapkan ke jaringan saraf.
Jaringan saraf memiliki beberapa parameter dasar, yaitu bobot dan biasnya. Jumlah bobot tergantung pada jumlah koneksi antara lapisan jaringan dan jumlah bias tergantung pada jumlah neuron.
Ukuran data yang diperlukan sangat tergantung pada -
Ini dikatakan, cara yang lebih tepat dan pasti untuk mengetahui apakah model overfitting adalah untuk memeriksa apakah kesalahan validasi dekat dengan kesalahan pelatihan. Jika ya, maka model tersebut berfungsi dengan baik. Jika tidak, maka model tersebut kemungkinan besar overfitting dan itu berarti Anda perlu mengurangi ukuran model Anda atau memperkenalkan teknik regularisasi.
sumber