Apa cara terbaik untuk mengkategorikan pendekatan yang telah dikembangkan untuk mengatasi masalah kelas ketidakseimbangan?
Artikel ini mengelompokkannya menjadi:
- Preprocessing: termasuk metode oversampling, undersampling dan hybrid,
- Pembelajaran sensitif biaya: termasuk metode langsung dan meta-learning yang selanjutnya dibagi menjadi thresholding dan sampling,
- Teknik ensemble: mencakup ansambel yang sensitif terhadap biaya dan pemrosesan data bersama dengan pembelajaran ansambel.
The kedua klasifikasi:
- Pra-pemrosesan data: termasuk perubahan distribusi dan pembobotan ruang data. Pembelajaran satu kelas dianggap sebagai perubahan distribusi.
- Metode Pembelajaran Tujuan Khusus
- Prediksi Post-processing: termasuk metode threshold dan post-processing yang sensitif biaya
- Metode Hibrida:
Artikel ketiga :
- Metode tingkat data
- Metode tingkat algoritma
- Metode hibrid
Klasifikasi terakhir juga menganggap penyesuaian output sebagai pendekatan independen.
Terima kasih sebelumnya.
Jawaban:
Cara saya melihatnya ketiga kategorisasi setuju dalam banyak hal. Misalnya, ketiganya memiliki kategori untuk langkah-langkah pra-pemrosesan.
Saya cenderung setuju pada kategorisasi ketiga karena lebih umum dan mencakup lebih banyak hal.
Satu-satunya hal yang hilang dari dua artikel pertama adalah langkah-langkah pasca-pemrosesan, yang sejujurnya, tidak digunakan dalam praktik sesering yang lain.
sumber