Saya tahu bahwa tidak ada jawaban yang jelas untuk pertanyaan ini, tetapi anggaplah saya memiliki jaringan saraf besar, dengan banyak data dan saya ingin menambahkan fitur baru dalam input. Cara "terbaik" adalah menguji jaringan dengan fitur baru dan melihat hasilnya, tetapi apakah ada metode untuk menguji apakah fitur tersebut SANGAT membantu? Suka tindakan korelasi ( http://www3.nd.edu/~mclark19/learn/CorrelationComparison.pdf ) dll?
16
Jawaban:
Korelasi yang sangat kuat antara fitur baru dan fitur yang ada adalah pertanda yang cukup baik bahwa fitur baru hanya memberikan sedikit informasi baru. Korelasi yang rendah antara fitur baru dan fitur yang ada kemungkinan lebih disukai.
Korelasi linear yang kuat antara fitur baru dan variabel yang diprediksi adalah pertanda baik bahwa fitur baru akan bernilai, tetapi tidak adanya korelasi yang tinggi tidak diperlukan tanda fitur yang buruk, karena jaringan saraf tidak terbatas pada kombinasi linier. variabel.
Jika fitur baru dibuat secara manual dari kombinasi fitur yang ada, pertimbangkan untuk tidak menggunakannya. Keindahan jaringan saraf adalah sedikit fitur rekayasa dan preprocessing diperlukan - fitur dipelajari oleh lapisan perantara. Kapan saja memungkinkan, lebih suka fitur pembelajaran daripada rekayasa mereka.
sumber
Jika Anda menggunakan sklearn, ada fungsi bagus yang tersedia bernama model.feature_importances_. Cobalah dengan model / fitur baru Anda dan lihat apakah itu membantu. Lihat juga di sini dan di sini untuk contoh.
sumber