augmentasi data saat menggunakan flow_from_directory di CNN

7

Saya ingin menggunakan dataset kecil untuk membuat model CNN. Jadi, saya menggunakan augmentasi data untuk meningkatkan dataset kereta. Haruskah saya menggunakan semua teknik augmentasi (argumen) yang tercantum di sini ?

Saya perhatikan bahwa menambahkan banyak argumen mengurangi keakuratan model dan membuat pelatihan lebih sulit daripada set pengujian.

Apa praktik terbaik untuk menggunakan augmentasi data saat digunakan flow_from_directory?

Noran
sumber

Jawaban:

6

Augmentasi seringkali bergantung pada sifat data Anda. Bayangkan jika hasil augmentasi logis dalam konteks Anda.

Sebagai contoh katakanlah Anda memiliki dataset kucing vs anjing. Gambar-gambar di sini dapat diputar ke kiri ke kanan. Di sisi lain dalam dataset MNIST tidak masuk akal untuk membalik gambar sama sekali (apa gunanya memberi makan '3' yang terbalik ke model Anda). Beberapa augmentasi mungkin benar-benar membingungkan model (misalnya terbalik '9' mungkin terlihat seperti '6').

Selain itu, jika augmetasi membuat model Anda lebih buruk, coba augmentasi yang lebih kecil (mis. Menempel transformasi affine dengan rentang kecil -[5 rotasi / terjemahan / penskalaan).

ILM91
sumber