Paket Pilihan Fitur dalam R, yang melakukan regresi dan klasifikasi

12

Saya sangat baru di R. Saya belajar pembelajaran mesin sekarang. Maaf, jika pertanyaan ini tampaknya sangat mendasar. Saya mencoba menemukan paket pemilihan fitur yang bagus di R. Saya pergi melalui paket Boruta. Ini adalah paket yang baik tetapi saya membaca bahwa ini hanya berguna untuk klasifikasi.

Saya ingin mengimplementasikan pemilihan fitur dalam R untuk tugas-tugas regresi. Saya membaca dokumentasi paket caret tetapi untuk level saya, sangat sulit untuk dipahami.

Adakah yang bisa mengarahkan saya ke tutorial yang bagus atau daftar paket yang bagus atau paket yang paling sering digunakan di R untuk pemilihan fitur.

Bantuan apa pun akan dihargai. Terima kasih sebelumnya.

pengguna1787687
sumber
3
Boruta bekerja dengan baik untuk regresi.

Jawaban:

13

Anda juga dapat melihat FSelector , varSelRF . FSelector berisi beberapa fungsi untuk pemilihan fitur berdasarkan misalnya pada uji chi square, pada teori informasi (entropi, informasi timbal balik, rasio perolehan, ...), pada korelasi antara fitur, konsistensi dll ... varSelRF adalah paket yang berguna untuk pemilihan fitur menggunakan hutan acak dengan eliminasi variabel mundur dan dengan spektrum penting.

WAF
sumber
2
Hai FWaldner, ini terlihat sedikit pendek untuk sebuah jawaban. Bisakah Anda mempertimbangkan untuk mengembangkannya dengan satu atau dua kalimat, mungkin untuk menyebutkan secara singkat apa yang dilakukan paket-paket ini seperti atau tidak seperti saran lainnya, atau bahkan mungkin terhadap hal-hal lain? Seperti berdiri pada dasarnya itu hanya sepasang tautan.
Glen_b -Reinstate Monica
Tampaknya varSelRF juga semata-mata ditujukan untuk klasifikasi Hutan Acak daripada regresi.
blmoore
7

Sudahkah Anda melihat Machine Learning & Statistics Learning, CRAN, Task View, di mana selain caret dan Boruta, beberapa paket lain disebutkan?

Secara umum, jika Anda tidak memahami prosedur statistik tertentu mengenai pemilihan fitur, mungkin lebih baik bagi Anda untuk mengajukan pertanyaan yang ditargetkan tentang hal itu. Tautan CV berikut ini mungkin sama bermanfaatnya sebagai permulaan: Algoritma untuk pemilihan model otomatis .

usεr11852
sumber
3

Saya menyarankan Rattle yang memiliki pemilihan fitur hutan acak (dan banyak lagi). Ini memiliki GUI yang bagus dan sangat mudah digunakan.

sashkello
sumber
1

GLMNET dengan regresi laso melakukan pemilihan fitur.

pengguna100653
sumber
1
Bisakah Anda memberikan jawaban terperinci?
Pelajar
1

Selain itu Caretpaket juga menyediakan metode pemilihan fitur. Berikut dan di sini adalah beberapa tutorial tentang cara menggunakan pemilihan fitur di Caret package. Baru-baru ini, paket pemilihan fitur berdasarkan algoritma SISAL oleh Tikka dan Hollmén tersedia di CRAN .

revsiplin
sumber
Tautan ke tutorial sudah mati. Namun, tautan ini bisa membantu.
Ekaba Bisong