Seperti diketahui oleh semua, rekayasa fitur sangat penting untuk pembelajaran mesin, namun saya menemukan beberapa bahan yang terkait dengan bidang ini. Saya berpartisipasi dalam beberapa kompetisi di Kaggle dan percaya bahwa fitur yang baik bahkan mungkin lebih penting daripada klasifikasi yang baik dalam beberapa kasus. Adakah yang tahu tutorial tentang rekayasa fitur, atau ini pengalaman murni?
19
Jawaban:
Saya akan mengatakan pengalaman - ide dasar adalah:
sumber
Ada sebuah buku dari O'Reilly yang disebut " Feature Engineering for Machine Learning " oleh Zheng et al.
Saya membaca buku dan mencakup berbagai jenis data (misalnya kategorikal, teks ...) dan menjelaskan berbagai aspek rekayasa fitur yang menyertainya. Ini termasuk hal-hal seperti normalisasi data, pemilihan fitur, tf-idf dalam teks.
sumber