Apa perbedaan antara Multiclass dan Multilabel Problem

52

Apa perbedaan antara masalah multikelas dan masalah multilabel?

Pelajar
sumber
Kedua tugas dapat diselesaikan dengan paket perangkat lunak Vowpal Wabbit (baris perintah, binding python tersedia).
Vladislavs Dovgalecs
Saya mempelajari konsep ini dan membangun pemahaman saya dengan posting ini , mereka menjelaskan klasifikasi multi-label dengan cara yang sangat elegan.
user235077

Jawaban:

45

Saya menduga perbedaannya adalah bahwa dalam masalah multi-kelas kelas-kelasnya saling eksklusif, sedangkan untuk masalah multi-label masing-masing label mewakili tugas klasifikasi yang berbeda, tetapi tugas tersebut entah bagaimana terkait (sehingga ada manfaat dalam menangani mereka bersama daripada secara terpisah ). Misalnya, dalam dataset kepiting leptograspus yang terkenal ada contoh jantan dan betina dari dua bentuk kepiting berwarna. Anda bisa mendekati ini sebagai masalah multi-kelas dengan empat kelas (pria-biru, wanita-biru, pria-oranye, wanita-oranye) atau sebagai masalah multi-label, di mana satu label adalah pria / wanita dan yang lainnya biru /jeruk. Pada dasarnya dalam masalah multi-label, suatu pola dapat dimiliki lebih dari satu kelas.

Dikran Marsupial
sumber
@ Dulran Terima kasih atas penjelasan Anda. Apakah Anda tahu sumber lain di mana saya bisa mendapatkan dataset multilabel selain csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/multilabel.html dan mulan.sourceforge.net/datasets.html
Learner
@Pelajar maaf itu bukan sesuatu yang telah saya kerjakan. Anda mungkin ingin melihat pembelajaran multi-tugas, yang memiliki beberapa kesamaan dengan pembelajaran multi-label. Mungkin beberapa dataset yang digunakan untuk itu mungkin juga berguna sebagai tolok ukur untuk pembelajaran multilabel.
Dikran Marsupial
26

Klasifikasi multiclass berarti tugas klasifikasi dengan lebih dari dua kelas; mis., mengklasifikasikan satu set gambar buah-buahan yang mungkin jeruk, apel, atau pir. Klasifikasi multi-kelas membuat asumsi bahwa masing-masing sampel ditugaskan untuk satu dan hanya satu label: buah dapat berupa apel atau pir tetapi tidak keduanya sekaligus.

Klasifikasi multilabel memberikan kepada masing-masing sampel satu set label target. Ini dapat dianggap sebagai memprediksi properti titik data yang tidak saling eksklusif, seperti topik yang relevan untuk dokumen. Sebuah teks mungkin tentang agama, politik, keuangan atau pendidikan pada saat yang sama atau tidak sama sekali.

Diambil dari http://scikit-learn.org/stable/modules/multiclass.html

Thamme Gowda
sumber
18

Untuk melengkapi jawaban lain, berikut adalah beberapa angka. Satu baris = output yang diharapkan untuk satu sampel.

Multiclass

Satu kolom = satu kelas (pengodean satu-panas)

masukkan deskripsi gambar di sini

Multilabel

Satu kolom = satu kelas

masukkan deskripsi gambar di sini


Kamu melihatnya:

  • dalam kasus multilabel, satu sampel mungkin ditugaskan lebih dari satu kelas.
  • dalam kasus multiclass, ada lebih dari 2 kelas secara total.

Sebagai catatan, tidak ada yang mencegah Anda dari masalah klasifikasi multioutput-multiclass , misalnya:

masukkan deskripsi gambar di sini

Franck Dernoncourt
sumber
7

Masalah multi-kelas memiliki penugasan instance ke salah satu dari koleksi kelas yang terbatas dan saling eksklusif. Seperti pada contoh yang sudah diberikan kepiting (dari @Dikran): jantan-biru, betina-biru, jantan-jingga, betina-jingga. Masing-masing adalah eksklusif dari yang lain dan secara bersama-sama mereka komprehensif.

Salah satu bentuk masalah multi-label adalah membaginya menjadi dua label, jenis kelamin dan warna; di mana seks bisa laki-laki atau perempuan, dan warnanya bisa biru atau oranye. Tetapi perhatikan bahwa ini adalah kasus khusus dari masalah multi-label karena setiap instance akan mendapatkan setiap label (yaitu setiap kepiting memiliki jenis kelamin dan warna).

Masalah multi-label juga termasuk kasus-kasus lain yang memungkinkan sejumlah variabel label ditugaskan untuk setiap contoh. Sebagai contoh, sebuah artikel di surat kabar atau layanan kawat dapat ditugaskan ke kategori BERITA, POLITIK, OLAHRAGA, OBAT, dll. Satu cerita tentang acara olahraga yang penting akan mendapatkan penugasan label SPORTS; sementara yang lain, yang melibatkan ketegangan politik yang diungkapkan oleh acara olahraga tertentu, mungkin mendapatkan label SPORTS dan POLITICS. Di mana saya berada, di AS, hasil Superbowl diberi label SPORTS dan NEWS mengingat dampak sosial dari acara tersebut.

Perhatikan bahwa bentuk pelabelan ini, dengan sejumlah variabel label, dapat disusun kembali menjadi bentuk yang mirip dengan contoh kepiting; kecuali bahwa setiap label diperlakukan sebagai LABEL-X atau tidak-LABEL-X. Tetapi tidak semua metode membutuhkan pengulangan ini.

Doctorambient
sumber
2

Dan satu lagi perbedaan terletak pada bahwa masalah multi-label membutuhkan model untuk mempelajari korelasi antara kelas-kelas yang berbeda, tetapi dalam masalah multiclass, kelas-kelas yang berbeda saling independen satu sama lain.

Lerner Zhang
sumber