Bisakah error kuadrat rata-rata digunakan untuk klasifikasi?
13
Saya tahu rumus kesalahan kuadrat rata-rata dan cara menghitungnya. Ketika kita berbicara tentang regresi, kita dapat menghitung rata-rata kesalahan kuadrat. Namun bisakah kita berbicara tentang MSE untuk masalah klasifikasi dan bagaimana cara menghitungnya?
Banyak pengklasifikasi dapat memprediksi skor kontinu. Seringkali, skor kontinu adalah hasil antara yang hanya dikonversi ke label kelas (biasanya dengan ambang batas) sebagai langkah terakhir klasifikasi. Dalam kasus lain, misalnya probabilitas posterior untuk keanggotaan kelas dapat dihitung (misalnya analisis diskriminan, regresi logistik). Anda dapat menghitung MSE menggunakan skor kontinu ini daripada label kelas. Keuntungannya adalah Anda menghindari hilangnya informasi karena dikotomisasi.
Ketika skor kontinu adalah probabilitas, metrik MSE disebut skor Brier.
Namun, ada juga masalah klasifikasi yang agak masalah regresi yang menyamar. Di bidang saya yang dapat misalnya mengklasifikasikan kasus berdasarkan apakah konsentrasi beberapa zat melebihi batas hukum atau tidak (yang merupakan masalah dua kelas biner / diskriminatif). Di sini, MSE adalah pilihan alami karena sifat regresi yang mendasari tugas.
Saya tidak mengerti bagaimana ... klasifikasi yang sukses adalah variabel biner (benar atau tidak), jadi sulit untuk melihat apa yang akan Anda kuadratkan.
Umumnya klasifikasi diukur pada indikator seperti persentase yang benar, ketika klasifikasi yang telah diperkirakan dari suatu set pelatihan, diterapkan pada set pengujian yang telah disisihkan sebelumnya.
Mean square error tentu saja dapat (dan) dihitung untuk prakiraan atau nilai prediksi dari variabel kontinu, tapi saya pikir tidak untuk klasifikasi.
Untuk taksiran probabilitas Anda ingin menghitung bukan MSE tetapi kemungkinan:π^
L=∏iπ^yii(1−π^i)1−yi
Kemungkinan ini untuk respons biner, yang diasumsikan memiliki distribusi Bernoulli.
Jika Anda mengambil log dan kemudian meniadakan, Anda mendapatkan kehilangan logistik, yang merupakan analog dari MSE ketika Anda memiliki respons biner. Secara khusus, MSE adalah kemungkinan log negatif untuk tanggapan berkelanjutan yang dianggap memiliki distribusi normal.L
Secara teknis Anda bisa, tetapi fungsi MSE adalah non-cembung untuk klasifikasi biner. Jadi, jika model klasifikasi biner dilatih dengan fungsi Biaya MSE, itu tidak dijamin untuk meminimalkan fungsi Biaya . Juga, menggunakan MSE sebagai fungsi biaya mengasumsikan distribusi Gaussian yang tidak berlaku untuk klasifikasi biner.
Mengapa MSE menganggap distribusi Gaussian? (Berbeda dengan, katakanlah, regresi kuadrat terkecil menggunakan MSE sebagai kerugian, dan kami dapat menunjukkan bahwa itu adalah optimal untuk masalah regresi dengan residu yang terdistribusi normal)
cbeleites tidak senang dengan SX
Ini tidak optimal untuk klasifikasi biner tetapi optimal untuk regresi. Pertanyaannya adalah untuk biner.
Mostafa Nakhaei
Pertanyaannya tidak mengatakan klasifikasi biner . Bahkan tidak menyebutkan klasifikasi diskriminatif. Dan itu tidak menanyakan tentang optimalitas (yang Anda harus tetap lebih spesifik tentang situasi bahkan daripada mengatakan biner atau diskriminatif dengan 2 kelas), hanya apakah MSE dapat digunakan. Selain itu, skor Brier adalah aturan penilaian yang sangat tepat untuk peramalan, jadi penjelasan yang lebih rinci tentang ketidak-optimalan tentu akan membantu (dan mungkin sangat menerangi kapan non-optimalitas ini berlaku).
Saya tidak mengerti bagaimana ... klasifikasi yang sukses adalah variabel biner (benar atau tidak), jadi sulit untuk melihat apa yang akan Anda kuadratkan.
Umumnya klasifikasi diukur pada indikator seperti persentase yang benar, ketika klasifikasi yang telah diperkirakan dari suatu set pelatihan, diterapkan pada set pengujian yang telah disisihkan sebelumnya.
Mean square error tentu saja dapat (dan) dihitung untuk prakiraan atau nilai prediksi dari variabel kontinu, tapi saya pikir tidak untuk klasifikasi.
sumber
Untuk taksiran probabilitas Anda ingin menghitung bukan MSE tetapi kemungkinan:π^
Kemungkinan ini untuk respons biner, yang diasumsikan memiliki distribusi Bernoulli.
Jika Anda mengambil log dan kemudian meniadakan, Anda mendapatkan kehilangan logistik, yang merupakan analog dari MSE ketika Anda memiliki respons biner. Secara khusus, MSE adalah kemungkinan log negatif untuk tanggapan berkelanjutan yang dianggap memiliki distribusi normal.L
sumber
Secara teknis Anda bisa, tetapi fungsi MSE adalah non-cembung untuk klasifikasi biner. Jadi, jika model klasifikasi biner dilatih dengan fungsi Biaya MSE, itu tidak dijamin untuk meminimalkan fungsi Biaya . Juga, menggunakan MSE sebagai fungsi biaya mengasumsikan distribusi Gaussian yang tidak berlaku untuk klasifikasi biner.
sumber