Saya ingin menguji model saya yang terlatih pada dataset yang tidak seimbang. Apakah ada algoritma yang tersedia untuk menghasilkan data sintetis dari dataset berlabel seimbang (spam / non-spam)?
unbalanced-classes
synthetic-data
Stuart Peterson
sumber
sumber
Jawaban:
Coba SMOTE , ini merupakan algoritma yang digunakan untuk pengambilan sampel berlebih. Ini menciptakan sampel sintetis dari kelas yang Anda inginkan sampel berlebihan.
Anda dapat menggunakan ini untuk membuat jumlah sampel yang Anda butuhkan.
sumber