Pertanyaan yang diberi tag unbalanced-classes

15
SVM untuk data yang tidak seimbang

Saya ingin mencoba menggunakan Support Vector Machines (SVMs) pada dataset saya. Sebelum saya mencoba masalah, saya diperingatkan bahwa SVM tidak bekerja dengan baik pada data yang sangat tidak seimbang. Dalam kasus saya, saya dapat memiliki sebanyak 95-98% 0 dan 2-5% 1. Saya mencoba untuk...

14
Akurasi seimbang vs skor F-1

Saya bertanya-tanya apakah ada yang bisa menjelaskan perbedaan antara akurasi yang seimbang b_acc = (sensitivity + specificity)/2 dan skor f1 yaitu: f1 = 2*precision*recall/(precision + recall)

10
Kurva ROC untuk dataset tidak seimbang

Pertimbangkan matriks input dan output biner .XXXyyy Cara umum untuk mengukur kinerja classifier adalah dengan menggunakan kurva ROC. Dalam plot ROC, diagonal adalah hasil yang akan diperoleh dari classifier acak. Dalam hal output tidak seimbang , kinerja classifier acak dapat ditingkatkan...

9
Berlebihan dengan variabel kategori

Saya ingin melakukan kombinasi oversampling dan undersampling untuk menyeimbangkan dataset saya dengan sekitar 4000 pelanggan dibagi menjadi dua kelompok, di mana salah satu grup memiliki proporsi sekitar 15%. Saya telah melihat SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) dan...

9
Model pembelajaran dalam mana yang dapat mengklasifikasikan kategori yang tidak eksklusif satu sama lain

Contoh: Saya memiliki kalimat dalam deskripsi pekerjaan: "Java senior engineer in UK". Saya ingin menggunakan model pembelajaran yang mendalam untuk memperkirakannya sebagai 2 kategori: English dan IT jobs. Jika saya menggunakan model klasifikasi tradisional, hanya dapat memprediksi 1 label dengan...