Ingatlah bahwa bentuk fungsional dari regresi logistik adalah
f( x ) = 11 + e- ( β0+ β1x1+ ⋯ + βkxk)
Inilah yang dikembalikan oleh predict_proba
.
Istilah di dalam eksponensial
d( x ) = β0+ β1x1+ ⋯ + βkxk
adalah apa yang dikembalikan oleh decision_function
. "Hyperplane" yang dimaksud dalam dokumentasi adalah
β0+ β1x1+ ⋯ + βkxk= 0
Terminologi ini adalah peninggalan dari mesin vektor dukungan, yang secara harfiah memperkirakan hyperplane pemisah. Untuk regresi logistik, hyperplane ini sedikit membangun buatan, itu adalah bidang probabilitas yang sama, di mana model telah menentukan kedua kelas target memiliki kemungkinan yang sama.
The predict
mengembalikan fungsi keputusan kelas menggunakan aturan
f( x ) > 0,5
Dengan risiko soapboxing, predict
fungsinya memiliki sangat sedikit kegunaan yang sah, dan saya melihatnya menggunakannya sebagai tanda kesalahan ketika meninjau pekerjaan orang lain. Saya akan pergi cukup jauh untuk menyebutnya kesalahan desain di sklearn itu sendiri ( predict_proba
fungsi seharusnya dipanggil predict
, dan predict
seharusnya dipanggil predict_class
, jika ada sama sekali).