Bisakah error kuadrat rata-rata digunakan untuk klasifikasi?

13

Saya tahu rumus kesalahan kuadrat rata-rata dan cara menghitungnya. Ketika kita berbicara tentang regresi, kita dapat menghitung rata-rata kesalahan kuadrat. Namun bisakah kita berbicara tentang MSE untuk masalah klasifikasi dan bagaimana cara menghitungnya?

kamaci
sumber

Jawaban:

12

Banyak pengklasifikasi dapat memprediksi skor kontinu. Seringkali, skor kontinu adalah hasil antara yang hanya dikonversi ke label kelas (biasanya dengan ambang batas) sebagai langkah terakhir klasifikasi. Dalam kasus lain, misalnya probabilitas posterior untuk keanggotaan kelas dapat dihitung (misalnya analisis diskriminan, regresi logistik). Anda dapat menghitung MSE menggunakan skor kontinu ini daripada label kelas. Keuntungannya adalah Anda menghindari hilangnya informasi karena dikotomisasi.
Ketika skor kontinu adalah probabilitas, metrik MSE disebut skor Brier.

Namun, ada juga masalah klasifikasi yang agak masalah regresi yang menyamar. Di bidang saya yang dapat misalnya mengklasifikasikan kasus berdasarkan apakah konsentrasi beberapa zat melebihi batas hukum atau tidak (yang merupakan masalah dua kelas biner / diskriminatif). Di sini, MSE adalah pilihan alami karena sifat regresi yang mendasari tugas.

Dalam makalah ini kami menjelaskannya sebagai bagian dari kerangka kerja yang lebih umum: C. Beleites, R. Salzer dan V. Sergo:
Validasi Model Klasifikasi Lunak menggunakan Keanggotaan Kelas Parsial: Konsep Sensitivitas Berkepanjangan & Co. yang diterapkan pada Grading of Astrocytoma Networks
Chemom. Intell. Laboratorium. Syst., 122 (2013), 12 - 22.

Cara menghitungnya: jika Anda bekerja di R, satu implementasi ada di paket "softclassval", http: /softclassval.r-forge.r-project.org.

cbeleites tidak senang dengan SX
sumber
@ seanv507: terima kasih banyak!
cbeleites tidak senang dengan SX
1

Saya tidak mengerti bagaimana ... klasifikasi yang sukses adalah variabel biner (benar atau tidak), jadi sulit untuk melihat apa yang akan Anda kuadratkan.

Umumnya klasifikasi diukur pada indikator seperti persentase yang benar, ketika klasifikasi yang telah diperkirakan dari suatu set pelatihan, diterapkan pada set pengujian yang telah disisihkan sebelumnya.

Mean square error tentu saja dapat (dan) dihitung untuk prakiraan atau nilai prediksi dari variabel kontinu, tapi saya pikir tidak untuk klasifikasi.

Peter Ellis
sumber
0

Untuk taksiran probabilitas Anda ingin menghitung bukan MSE tetapi kemungkinan:π^

L=iπ^iyi(1π^i)1yi

Kemungkinan ini untuk respons biner, yang diasumsikan memiliki distribusi Bernoulli.

Jika Anda mengambil log dan kemudian meniadakan, Anda mendapatkan kehilangan logistik, yang merupakan analog dari MSE ketika Anda memiliki respons biner. Secara khusus, MSE adalah kemungkinan log negatif untuk tanggapan berkelanjutan yang dianggap memiliki distribusi normal.L

pengguna0
sumber
0

Secara teknis Anda bisa, tetapi fungsi MSE adalah non-cembung untuk klasifikasi biner. Jadi, jika model klasifikasi biner dilatih dengan fungsi Biaya MSE, itu tidak dijamin untuk meminimalkan fungsi Biaya . Juga, menggunakan MSE sebagai fungsi biaya mengasumsikan distribusi Gaussian yang tidak berlaku untuk klasifikasi biner.

Mostafa Nakhaei
sumber
1
Mengapa MSE menganggap distribusi Gaussian? (Berbeda dengan, katakanlah, regresi kuadrat terkecil menggunakan MSE sebagai kerugian, dan kami dapat menunjukkan bahwa itu adalah optimal untuk masalah regresi dengan residu yang terdistribusi normal)
cbeleites tidak senang dengan SX
Ini tidak optimal untuk klasifikasi biner tetapi optimal untuk regresi. Pertanyaannya adalah untuk biner.
Mostafa Nakhaei
Pertanyaannya tidak mengatakan klasifikasi biner . Bahkan tidak menyebutkan klasifikasi diskriminatif. Dan itu tidak menanyakan tentang optimalitas (yang Anda harus tetap lebih spesifik tentang situasi bahkan daripada mengatakan biner atau diskriminatif dengan 2 kelas), hanya apakah MSE dapat digunakan. Selain itu, skor Brier adalah aturan penilaian yang sangat tepat untuk peramalan, jadi penjelasan yang lebih rinci tentang ketidak-optimalan tentu akan membantu (dan mungkin sangat menerangi kapan non-optimalitas ini berlaku).
cbeleites tidak senang dengan SX