Jadi saya sudah bermain-main dengan SVM dan saya ingin tahu apakah ini hal yang baik untuk dilakukan:
Saya memiliki serangkaian fitur berkelanjutan (0 hingga 1) dan serangkaian fitur kategorikal yang saya konversi ke variabel dummy. Dalam kasus khusus ini, saya menyandikan tanggal pengukuran dalam variabel dummy:
Ada 3 periode tempat saya mendapatkan data dan saya mencadangkan 3 nomor fitur untuk mereka:
20:21: 22:
Jadi tergantung pada periode mana data berasal, fitur yang berbeda akan mendapatkan 1 ditugaskan; yang lain akan mendapat 0.
Apakah SVM bekerja dengan baik dengan ini atau ini adalah hal yang buruk untuk dilakukan?
Saya menggunakan SVMLight dan kernel linear.
categorical-data
svm
feature-selection
linear-model
feature-construction
pengguna3010273
sumber
sumber
Jawaban:
SVM akan menangani variabel biner dan kontinu selama Anda membuat beberapa preprocessing: semua fitur harus diskalakan atau dinormalisasi. Setelah langkah itu, dari perspektif algoritme, tidak masalah jika fitur bersifat kontinu atau biner: untuk biner, ia melihat sampel yang "jauh", atau sangat mirip; untuk kontinu ada juga di antara nilai-nilai. Kernel tidak masalah sehubungan dengan jenis variabel.
sumber
Meniru jawaban saya dari http://www.quora.com/Machine-Learning/What-are-good-ways-to-handle-discrete-and-continuous-inputs-together/answer/Arun-Iyer-1
Sekarang, Anda dapat mewakili semua fitur dalam satu vektor yang dapat kita asumsikan tertanam dalam dan mulai menggunakan paket yang tidak tersedia untuk klasifikasi / regresi dll.Rn
sumber