Pertanyaan ini bisa di sini atau di SO mungkin ...
Misalkan set data pelatihan Anda berisi data kategorikal dan berkelanjutan seperti pengaturan ini:
Animal, breed, sex, age, weight, blood_pressure, annual_cost
cat, calico, M, 10, 15 , 100 , 100
cat, tabby, F, 5, 10 , 80 , 200
dog, beagle, M, 3, 30 , 90 , 200
dog, lab, F, 8, 75 , 80 , 100
Dan variabel dependen yang akan diprediksi adalah biaya dokter hewan tahunan. Saya agak bingung dengan teknik spesifik yang tersedia untuk menangani dataset seperti itu. Apa metode yang biasa digunakan untuk menangani dataset yang merupakan campuran data kontinu dan kategorikal?
sumber
Anda harus melihat pada pra-pemrosesan data . Itu sebelum teknik pembelajaran mesin. Ini adalah pengantar yang bagus (ditemukan di Google).
Mengenai teknik, ada banyak pendekatan berbeda . Anda mungkin dapat menggunakan sebagian besar dari mereka setelah memproses data Anda sebelumnya. Anda harus mencobanya dan memilih yang paling sesuai dengan kebutuhan Anda.
sumber