Saya mendapatkan model untuk regresi logistik untuk multiclass yang diberikan oleh
di mana k adalah jumlah kelas theta adalah parameter yang harus diperkirakan j adalah kelas j Xi adalah data pelatihan
Yah satu hal yang tidak saya dapatkan adalah bagaimana bagian penyebut menormalkan model. Maksud saya itu membuat probabilitas tetap antara 0 dan 1.
Maksud saya, saya terbiasa dengan regresi logistik
Sebenarnya saya bingung dengan masalah nominasi. Dalam hal ini karena ini adalah fungsi sigmoid, ia tidak pernah membiarkan nilainya kurang dari 0 atau lebih besar dari 1. Tapi saya bingung dalam kasus multi-kelas. Kenapa gitu?
Ini adalah referensi saya https://list.scms.waikato.ac.nz/pipermail/wekalist/2005-February/029738.html . Saya pikir itu seharusnya menjadi normalisasi
sumber
Jawaban:
Formula Anda salah (batas atas jumlah). Dalam regresi logistik dengan kelas ( ) Anda pada dasarnya membuat model regresi logistik biner mana Anda memilih satu kelas sebagai referensi atau pivot. Biasanya, kelas terakhir dipilih sebagai referensi. Dengan demikian, probabilitas kelas referensi dapat dihitung denganBentuk umum probabilitasnya adalahKarena kelas -th adalah referensi Anda dan karenanyaK > 2 K - 1 K P ( y i = K | x i ) = 1 - K - 1 Σ k = 1 P ( y i = k | x i ) . P ( y i = k | x i ) = exp ( θ T i x i )K K> 2 K- 1 K
sumber
Saya pikir Anda sedang bingung oleh salah ketik: Anda harus pada persamaan pertama. Angka 1 yang Anda lihat dalam kasus logistik sebenarnya s, misalnya, ketika ada th . k - 1 exp ( 0 ) k θ = 0k k−1 exp(0) k θ=0
Asumsikan . Sekarang perhatikan bahwa Anda bisa mendapatkan dari formulasi terakhir ke versi regresi logistik seperti Untuk beberapa kelas, cukup ganti penyebut dalam dua kuantitas pertama dengan jumlah lebih dari prediksi linear eksponensial. exp ( b )θ1X=b
sumber