Kedua tugas dapat diselesaikan dengan paket perangkat lunak Vowpal Wabbit (baris perintah, binding python tersedia).
Vladislavs Dovgalecs
Saya mempelajari konsep ini dan membangun pemahaman saya dengan posting ini , mereka menjelaskan klasifikasi multi-label dengan cara yang sangat elegan.
user235077
Jawaban:
45
Saya menduga perbedaannya adalah bahwa dalam masalah multi-kelas kelas-kelasnya saling eksklusif, sedangkan untuk masalah multi-label masing-masing label mewakili tugas klasifikasi yang berbeda, tetapi tugas tersebut entah bagaimana terkait (sehingga ada manfaat dalam menangani mereka bersama daripada secara terpisah ). Misalnya, dalam dataset kepiting leptograspus yang terkenal ada contoh jantan dan betina dari dua bentuk kepiting berwarna. Anda bisa mendekati ini sebagai masalah multi-kelas dengan empat kelas (pria-biru, wanita-biru, pria-oranye, wanita-oranye) atau sebagai masalah multi-label, di mana satu label adalah pria / wanita dan yang lainnya biru /jeruk. Pada dasarnya dalam masalah multi-label, suatu pola dapat dimiliki lebih dari satu kelas.
@Pelajar maaf itu bukan sesuatu yang telah saya kerjakan. Anda mungkin ingin melihat pembelajaran multi-tugas, yang memiliki beberapa kesamaan dengan pembelajaran multi-label. Mungkin beberapa dataset yang digunakan untuk itu mungkin juga berguna sebagai tolok ukur untuk pembelajaran multilabel.
Dikran Marsupial
26
Klasifikasi multiclass berarti tugas klasifikasi dengan lebih dari dua kelas; mis., mengklasifikasikan satu set gambar buah-buahan yang mungkin jeruk, apel, atau pir. Klasifikasi multi-kelas membuat asumsi bahwa masing-masing sampel ditugaskan untuk satu dan hanya satu label: buah dapat berupa apel atau pir tetapi tidak keduanya sekaligus.
Klasifikasi multilabel memberikan kepada masing-masing sampel satu set label target. Ini dapat dianggap sebagai memprediksi properti titik data yang tidak saling eksklusif, seperti topik yang relevan untuk dokumen. Sebuah teks mungkin tentang agama, politik, keuangan atau pendidikan pada saat yang sama atau tidak sama sekali.
Masalah multi-kelas memiliki penugasan instance ke salah satu dari koleksi kelas yang terbatas dan saling eksklusif. Seperti pada contoh yang sudah diberikan kepiting (dari @Dikran): jantan-biru, betina-biru, jantan-jingga, betina-jingga. Masing-masing adalah eksklusif dari yang lain dan secara bersama-sama mereka komprehensif.
Salah satu bentuk masalah multi-label adalah membaginya menjadi dua label, jenis kelamin dan warna; di mana seks bisa laki-laki atau perempuan, dan warnanya bisa biru atau oranye. Tetapi perhatikan bahwa ini adalah kasus khusus dari masalah multi-label karena setiap instance akan mendapatkan setiap label (yaitu setiap kepiting memiliki jenis kelamin dan warna).
Masalah multi-label juga termasuk kasus-kasus lain yang memungkinkan sejumlah variabel label ditugaskan untuk setiap contoh. Sebagai contoh, sebuah artikel di surat kabar atau layanan kawat dapat ditugaskan ke kategori BERITA, POLITIK, OLAHRAGA, OBAT, dll. Satu cerita tentang acara olahraga yang penting akan mendapatkan penugasan label SPORTS; sementara yang lain, yang melibatkan ketegangan politik yang diungkapkan oleh acara olahraga tertentu, mungkin mendapatkan label SPORTS dan POLITICS. Di mana saya berada, di AS, hasil Superbowl diberi label SPORTS dan NEWS mengingat dampak sosial dari acara tersebut.
Perhatikan bahwa bentuk pelabelan ini, dengan sejumlah variabel label, dapat disusun kembali menjadi bentuk yang mirip dengan contoh kepiting; kecuali bahwa setiap label diperlakukan sebagai LABEL-X atau tidak-LABEL-X. Tetapi tidak semua metode membutuhkan pengulangan ini.
Dan satu lagi perbedaan terletak pada bahwa masalah multi-label membutuhkan model untuk mempelajari korelasi antara kelas-kelas yang berbeda, tetapi dalam masalah multiclass, kelas-kelas yang berbeda saling independen satu sama lain.
Jawaban:
Saya menduga perbedaannya adalah bahwa dalam masalah multi-kelas kelas-kelasnya saling eksklusif, sedangkan untuk masalah multi-label masing-masing label mewakili tugas klasifikasi yang berbeda, tetapi tugas tersebut entah bagaimana terkait (sehingga ada manfaat dalam menangani mereka bersama daripada secara terpisah ). Misalnya, dalam dataset kepiting leptograspus yang terkenal ada contoh jantan dan betina dari dua bentuk kepiting berwarna. Anda bisa mendekati ini sebagai masalah multi-kelas dengan empat kelas (pria-biru, wanita-biru, pria-oranye, wanita-oranye) atau sebagai masalah multi-label, di mana satu label adalah pria / wanita dan yang lainnya biru /jeruk. Pada dasarnya dalam masalah multi-label, suatu pola dapat dimiliki lebih dari satu kelas.
sumber
Klasifikasi multiclass berarti tugas klasifikasi dengan lebih dari dua kelas; mis., mengklasifikasikan satu set gambar buah-buahan yang mungkin jeruk, apel, atau pir. Klasifikasi multi-kelas membuat asumsi bahwa masing-masing sampel ditugaskan untuk satu dan hanya satu label: buah dapat berupa apel atau pir tetapi tidak keduanya sekaligus.
Klasifikasi multilabel memberikan kepada masing-masing sampel satu set label target. Ini dapat dianggap sebagai memprediksi properti titik data yang tidak saling eksklusif, seperti topik yang relevan untuk dokumen. Sebuah teks mungkin tentang agama, politik, keuangan atau pendidikan pada saat yang sama atau tidak sama sekali.
Diambil dari http://scikit-learn.org/stable/modules/multiclass.html
sumber
Untuk melengkapi jawaban lain, berikut adalah beberapa angka. Satu baris = output yang diharapkan untuk satu sampel.
Multiclass
Satu kolom = satu kelas (pengodean satu-panas)
Multilabel
Satu kolom = satu kelas
Kamu melihatnya:
Sebagai catatan, tidak ada yang mencegah Anda dari masalah klasifikasi multioutput-multiclass , misalnya:
sumber
Masalah multi-kelas memiliki penugasan instance ke salah satu dari koleksi kelas yang terbatas dan saling eksklusif. Seperti pada contoh yang sudah diberikan kepiting (dari @Dikran): jantan-biru, betina-biru, jantan-jingga, betina-jingga. Masing-masing adalah eksklusif dari yang lain dan secara bersama-sama mereka komprehensif.
Salah satu bentuk masalah multi-label adalah membaginya menjadi dua label, jenis kelamin dan warna; di mana seks bisa laki-laki atau perempuan, dan warnanya bisa biru atau oranye. Tetapi perhatikan bahwa ini adalah kasus khusus dari masalah multi-label karena setiap instance akan mendapatkan setiap label (yaitu setiap kepiting memiliki jenis kelamin dan warna).
Masalah multi-label juga termasuk kasus-kasus lain yang memungkinkan sejumlah variabel label ditugaskan untuk setiap contoh. Sebagai contoh, sebuah artikel di surat kabar atau layanan kawat dapat ditugaskan ke kategori BERITA, POLITIK, OLAHRAGA, OBAT, dll. Satu cerita tentang acara olahraga yang penting akan mendapatkan penugasan label SPORTS; sementara yang lain, yang melibatkan ketegangan politik yang diungkapkan oleh acara olahraga tertentu, mungkin mendapatkan label SPORTS dan POLITICS. Di mana saya berada, di AS, hasil Superbowl diberi label SPORTS dan NEWS mengingat dampak sosial dari acara tersebut.
Perhatikan bahwa bentuk pelabelan ini, dengan sejumlah variabel label, dapat disusun kembali menjadi bentuk yang mirip dengan contoh kepiting; kecuali bahwa setiap label diperlakukan sebagai LABEL-X atau tidak-LABEL-X. Tetapi tidak semua metode membutuhkan pengulangan ini.
sumber
Dan satu lagi perbedaan terletak pada bahwa masalah multi-label membutuhkan model untuk mempelajari korelasi antara kelas-kelas yang berbeda, tetapi dalam masalah multiclass, kelas-kelas yang berbeda saling independen satu sama lain.
sumber