Masalah merancang multi-classifier menggunakan LDA dapat dinyatakan sebagai masalah 2 kelas (satu vs yang lainnya) atau masalah multi-kelas .
Mengapa dalam kasus-kasus tertentu multi-class LDA classifier out-melakukan 2 kelas LDA (satu vs yang lainnya) atau sebaliknya .
Jawaban:
Saya pikir Multi-class LDA classifier selalu (well, dalam sebagian besar tugas praktis) lebih baik dari 2 LDA class. Dan saya akan mencoba menjelaskan mengapa.
Lihatlah contoh dataset:
Anda memiliki tiga kelas di sini. Dan katakanlah Anda ingin membangun classifier satu-vs-lainnya dengan LDA untuk kelas biru.
Perkiraan rata-rata untuk kelas "biru" adalah nol, tetapi estimasi rata-rata untuk kelas "lain" adalah nol juga. Dan kovariansnya sama dengan definisi LDA. Itu berarti bahwa LDA akan merespons dengan label yang memiliki lebih banyak elemen. Dan itu tidak akan pernah mengembalikan kelas "biru" sama sekali!
Untuk LDA Multi-kelas, ia akan berhasil menemukan kelas yang tepat dengan sempurna.
Latar belakang tentang hal ini adalah bahwa campuran Gaussians bukan Gaussian lagi dalam banyak kasus. Jadi asumsi LDA ini gagal. Dan saya harus mengatakan itu benar-benar sulit untuk datang dengan contoh dataset di mana setiap kelas Gaussian, dan mereka masih Gaussian setelah kita bergabung dengan mereka.
Itu sebabnya saya sangat merekomendasikan untuk menggunakan LDA multi-kelas. Semoga ini bisa membantu!
sumber