Bagaimana cara menerapkan jaringan saraf pada masalah klasifikasi multi-label?

12

Deskripsi:

Biarkan domain masalah menjadi klasifikasi dokumen di mana terdapat satu set vektor fitur, masing-masing milik 1 atau lebih kelas. Misalnya, dokumen doc_1mungkin milik Sportsdan Englishkategori.

Pertanyaan:

Menggunakan jaringan saraf untuk klasifikasi, apa label untuk vektor fitur? apakah itu akan menjadi vektor yang membentuk semua kelas sehingga nilai 0 diberikan untuk kelas yang tidak relevan dan 1 untuk kelas yang relevan? Jadi, jika daftar label kelas adalah [Sports, News, Action, English, Japanese], maka untuk dokumen doc_1labelnya adalah [1, 0, 0, 1, 0]?

Ingin tahu
sumber

Jawaban:

3

Ya, dalam pembelajaran multi-label, informasi label sering disandikan sebagai vektor biner yang Anda gambarkan. Juga lebih mudah untuk evaluasi.

Kami mungkin ingin memeriksa MULAN , perpustakaan Java open source untuk pembelajaran multi-label. Ini adalah ekstensi Weka dan telah menerapkan banyak pengklasifikasi multi-label, termasuk jaringan saraf. Misalnya, Anda dapat menemukan BP-MLL di sini .

Weiwei
sumber
8

Ini sepertinya adalah makalah yang Anda cari:

Min-Ling Zhang dan Zhi-Hua Zhou: Jaringan Saraf Multi-Label dengan Aplikasi untuk Genomik Fungsional dan Kategorisasi Teks

Dari abstrak:

Dalam pembelajaran multi-label, setiap instance dalam set pelatihan dikaitkan dengan serangkaian label, dan tugasnya adalah untuk mengeluarkan set label yang ukurannya tidak diketahui a priori untuk setiap instance yang tidak terlihat. Dalam tulisan ini, masalah ini dibahas dalam cara suatu algoritma jaringan saraf bernama BP-MLL, yaitu Backpropagation untuk Multi-Label Learning, diusulkan. ... Aplikasi untuk dua masalah pembelajaran multi-label dunia nyata, yaitu genomik fungsional dan kategorisasi teks, menunjukkan bahwa kinerja BP-MLL lebih unggul daripada beberapa algoritma pembelajaran multi-label yang sudah mapan.

steffen
sumber