Saya berpartisipasi dalam kompetisi kaggle. Dataset memiliki sekitar 100 fitur dan semuanya tidak diketahui (dalam hal apa yang sebenarnya mereka wakili). Pada dasarnya mereka hanya angka. Orang-orang melakukan banyak rekayasa fitur pada fitur-fitur ini. Saya bertanya-tanya bagaimana tepatnya...