Saya memahami bahwa salah satu alasan regresi logistik sering digunakan untuk memprediksi rasio klik-tayang di web adalah karena ia menghasilkan model yang terkalibrasi dengan baik. Apakah ada penjelasan matematis yang bagus untuk ini?
regression
logistic
lsankar4033
sumber
sumber
Jawaban:
Iya.
Vektor probabilitas yang diprediksihal dari regresi logistik memenuhi persamaan matriks
Di mana adalah matriks desain dan adalah vektor respons. Hal ini dapat dilihat sebagai kumpulan dari persamaan linear, satu yang timbul dari setiap kolom dari desain matriks .y XX y X
Mengkhususkan diri untuk mencegat kolom (yang merupakan baris dalam matriks yang dipindahkan), persamaan linier terkait adalah
sehingga rata-rata probabilitas prediksi keseluruhan sama dengan rata-rata respons.
Secara umum, untuk kolom fitur biner , persamaan linear yang terkait adalahxsaya j
jadi jumlah (dan karenanya rata-rata) dari probabilitas yang diprediksi sama dengan jumlah dari respons, bahkan ketika mengkhususkan pada catatan-catatan yang .xsaya j= 1
sumber
Saya pikir saya bisa memberi Anda penjelasan yang mudah dipahami sebagai berikut:
Kita tahu bahwa fungsi kerugiannya dapat dinyatakan sebagai fungsi berikut: Dimana mewakili jumlah semua sampel pelatihan, label sampel ke-i, probabilitas yang diprediksi dari sampel ke-i: . (perhatikan bias sini)
J(θ)=−1m∑i=1m[y(i)log(hθ(x(i)))+(1−y(i))log(1−hθ(x(i)))]
y(i) hθ(x(i)) 11+exp[−α−∑jθjx(i)j] α
m
Karena tujuan pelatihan adalah untuk meminimalkan fungsi kerugian, mari kita evaluasi turunan parsialnya berkenaan dengan setiap parameter (derivasi terperinci dapat ditemukan di sini ): Dan mengaturnya ke nol yeils:θj
∂J(θ)∂θj=1m∑i=1m[hθ(x(i))−y(i)]x(i)j
∑i=1mhθ(x(i))x(i)j=∑i=1my(i)x(i)j
Itu berarti bahwa jika model sepenuhnya terlatih, probabilitas yang diprediksi yang kita dapatkan untuk set pelatihan menyebar sendiri sehingga untuk setiap fitur jumlah dari nilai-nilai tertimbang (semua) dari fitur itu sama dengan jumlah nilai-nilai fitur itu dari sampel positif.
Di atas cocok dengan setiap fitur sehingga bias . Menetapkan sebagai 1 dan sebagai yeilds: Kemudian kita mendapatkan: Di mana adalah probabilitas yang diprediksi dari model yang terlatih penuh untuk sampel engan. Dan kita dapat menulis fungsi dengan cara yang ringkas:α x0 α θ0
∑i=1mhθ(x(i))x(i)0=∑i=1my(i)x(i)0 ∑i=1mhθ(x(i))=∑i=1my(i) hθ(x(i)) ∑i=1mp(i)=∑i=1my(i)
Kita dapat melihat dengan jelas bahwa regresi logistik dikalibrasi dengan baik.
Referensi: Model Log-linear dan Bidang Acak Bersyarat oleh Charles Elkan
sumber