Saat mempelajari metode penambangan data, saya memahami bahwa ada dua kategori utama:
Metode prediksi:
- Klasifikasi
- Regresi
Metode deskriptif:
- Clustering
- Aturan asosiasi
Karena saya ingin memprediksi ketersediaan pengguna (output) berdasarkan lokasi, aktivitas, tingkat baterai (input untuk model pelatihan), saya pikir sudah jelas bahwa saya akan memilih "Metode prediktif", tetapi sekarang saya tidak bisa memilih antara klasifikasi dan regresi. Dari apa yang saya pahami sejauh ini, klasifikasi dapat menyelesaikan masalah saya, karena outputnya "tersedia" atau "tidak tersedia".
Bisakah klasifikasi memberi saya probabilitas (atau kemungkinan) dari pengguna yang tersedia atau tidak tersedia?
Seperti dalam output tidak hanya 0 (tidak tersedia) atau 1 (tersedia), tapi itu seperti:
- tersedia
- tidak tersedia
Bisakah masalah ini juga diselesaikan dengan menggunakan regresi?
Anda dapat menggunakan klasifikasi naif bayes dan menghitung probabilitas posterior menggunakan keyakinan sebelumnya atau regresi logistik dapat digunakan dengan fungsi sigmoid.
sumber