Pertanyaan yang sangat menarik (+1). Meskipun saya tidak mengetahui adanya alat perangkat lunak yang saat ini menawarkan fungsionalitas komprehensif untuk rekayasa fitur , pasti ada berbagai pilihan dalam hal itu. Saat ini, sejauh yang saya tahu, rekayasa fitur sebagian besar masih merupakan proses yang melelahkan dan manual (yaitu, lihat posting blog ini ). Berbicara tentang domain subjek rekayasa fitur, artikel yang sangat bagus ini oleh Jason Brownlee memberikan tinjauan yang agak komprehensif tentang topik tersebut.
Ben Lorica, Kepala Ilmuwan Data dan Direktur Strategi Konten untuk Data di O'Reilly Media Inc., telah menulis artikel yang sangat bagus , menggambarkan pendekatan, metode, alat, dan startup canggih (pada Juni 2014) bidang otomatisasi (atau, seperti yang ia katakan, perampingan ) rekayasa fitur.
Saya melihat sekilas beberapa startup yang dirujuk Ben dan sebuah produk oleh Skytree memang terlihat cukup mengesankan, terutama dalam hal subjek pertanyaan ini. Karena itu, beberapa klaim mereka terdengar sangat mencurigakan bagi saya (yaitu, "Skytree mempercepat metode pembelajaran mesin hingga 150x dibandingkan dengan opsi open source" ). Terus berbicara tentang ilmu data komersial dan penawaran pembelajaran mesin, saya harus menyebutkan solusi oleh Microsoft, khususnya Azure Machine Learning Studio mereka . Produk berbasis web ini cukup kuat dan elegan dan menawarkan beberapa fitur fitur fungsionalitas (FEF). Untuk contoh beberapa FEF sederhana, lihat video yang bagus ini .
Kembali ke pertanyaan, saya pikir bahwa pendekatan paling sederhana yang dapat diterapkan untuk mengotomatisasi rekayasa fitur adalah dengan menggunakan IDE yang sesuai . Karena Anda (saya juga) tertarik pada bahasa R sebagai backend sains data, saya sarankan untuk memeriksa, selain RStudio, IDE open source serupa lainnya, yang disebut RKWard . Salah satu keunggulan RKWard vs RStudio adalah mendukung plugin penulisan untuk IDE, sehingga memungkinkan para ilmuwan data mengotomatiskan rekayasa fitur dan merampingkan analisis data berbasis R mereka.
Akhirnya, di sisi lain dari spektrum solusi rekayasa fitur kita dapat menemukan beberapa proyek penelitian . Dua yang paling menonjol tampaknya adalah proyek Columbus Universitas Stanford , dijelaskan secara rinci dalam makalah penelitian yang sesuai , dan Brainwash , yang dijelaskan dalam makalah ini .