Saya sangat baru di R. Saya belajar pembelajaran mesin sekarang. Maaf, jika pertanyaan ini tampaknya sangat mendasar. Saya mencoba menemukan paket pemilihan fitur yang bagus di R. Saya pergi melalui paket Boruta. Ini adalah paket yang baik tetapi saya membaca bahwa ini hanya berguna untuk klasifikasi.
Saya ingin mengimplementasikan pemilihan fitur dalam R untuk tugas-tugas regresi. Saya membaca dokumentasi paket caret tetapi untuk level saya, sangat sulit untuk dipahami.
Adakah yang bisa mengarahkan saya ke tutorial yang bagus atau daftar paket yang bagus atau paket yang paling sering digunakan di R untuk pemilihan fitur.
Bantuan apa pun akan dihargai. Terima kasih sebelumnya.
r
feature-selection
pengguna1787687
sumber
sumber
Jawaban:
Anda juga dapat melihat FSelector , varSelRF . FSelector berisi beberapa fungsi untuk pemilihan fitur berdasarkan misalnya pada uji chi square, pada teori informasi (entropi, informasi timbal balik, rasio perolehan, ...), pada korelasi antara fitur, konsistensi dll ... varSelRF adalah paket yang berguna untuk pemilihan fitur menggunakan hutan acak dengan eliminasi variabel mundur dan dengan spektrum penting.
sumber
Sudahkah Anda melihat Machine Learning & Statistics Learning, CRAN, Task View, di mana selain caret dan Boruta, beberapa paket lain disebutkan?
Secara umum, jika Anda tidak memahami prosedur statistik tertentu mengenai pemilihan fitur, mungkin lebih baik bagi Anda untuk mengajukan pertanyaan yang ditargetkan tentang hal itu. Tautan CV berikut ini mungkin sama bermanfaatnya sebagai permulaan: Algoritma untuk pemilihan model otomatis .
sumber
Saya menyarankan Rattle yang memiliki pemilihan fitur hutan acak (dan banyak lagi). Ini memiliki GUI yang bagus dan sangat mudah digunakan.
sumber
GLMNET dengan regresi laso melakukan pemilihan fitur.
sumber
Selain itu
Caret
paket juga menyediakan metode pemilihan fitur. Berikut dan di sini adalah beberapa tutorial tentang cara menggunakan pemilihan fitur diCaret package
. Baru-baru ini, paket pemilihan fitur berdasarkan algoritma SISAL oleh Tikka dan Hollmén tersedia di CRAN .sumber