Mengapa regresi logistik adalah classifier linier?

49

Karena kita menggunakan fungsi logistik untuk mengubah kombinasi linear dari input menjadi output non-linear, bagaimana regresi logistik dapat dianggap sebagai classifier linier?

Regresi linier sama seperti jaringan saraf tanpa lapisan tersembunyi, jadi mengapa jaringan saraf dianggap sebagai pengklasifikasi non-linear dan regresi logistik linear?

Jack Twain
sumber
7
Transformasi "kombinasi linear dari input menjadi output non-linear" adalah bagian dasar dari definisi dari Classifier Linear . Itu mengurangi pertanyaan ini menjadi bagian kedua, yang berarti mendemonstrasikan bahwa Neural Networks secara umum tidak dapat dinyatakan sebagai pengklasifikasi linier.
Whuber
1
@whuber: Bagaimana Anda menjelaskan fakta bahwa model regresi logistik dapat mengambil variabel prediktor polinomial (misalnya ) untuk menghasilkan batas keputusan non-linear? Apakah itu masih merupakan classifier linier? w1x12+w2x23
stackoverflowuser2010
4
@ Stack Konsep "linear classifier" tampaknya berasal dengan konsep model linear. "Linearity" dalam model dapat mengambil beberapa bentuk, seperti yang dijelaskan di stats.stackexchange.com/a/148713 . Jika kami menerima karakterisasi Wikipedia dari pengklasifikasi linier , maka contoh polinomial Anda akan dipandang sebagai nonlinier dalam hal "fitur" yang diberikan dan tetapi akan linier dalam hal fitur dan . Perbedaan ini memberikan cara yang bermanfaat untuk mengeksploitasi sifat linearitas. x1x2x12x23
whuber
1
Saya masih agak bingung tentang pertanyaannya, apakah batas keputusan dari linear classifier logistik? Saya telah mengikuti kursus pembelajaran mesin Andrew Ng di Coursera dan dia menyebutkan yang berikut ini :! [Masukkan deskripsi gambar di sini ] ( i.stack.imgur.com/gHxfr.png ) Jadi sebenarnya menurut saya tidak ada yang menjawabnya tergantung pada linearitas atau non-linearitas dari batas keputusan, itu tergantung pada fungsi Hipotesis yang didefinisikan sebagai Htheta (X) di mana X adalah input dan Theta adalah variabel dari masalah kita. Apakah itu masuk akal untuk Anda?
brokensword

Jawaban:

42

Regresi logistik linier dalam arti bahwa prediksi dapat ditulis sebagai Dengan demikian, prediksi dapat ditulis dalam bentuk , yang merupakan fungsi linier dari . (Lebih tepatnya, odds log yang diprediksi adalah fungsi linier dari .)

p^=11+eμ^, where μ^=θ^x.
μ^xx

Sebaliknya, tidak ada cara untuk meringkas output dari jaringan saraf dalam hal fungsi linear , dan itulah sebabnya jaringan saraf disebut non-linear.x

Juga, untuk regresi logistik, batas keputusan adalah linier: itu adalah solusi untuk . Batas keputusan jaringan saraf pada umumnya tidak linier.{x:p^=0.5}θ^x=0

Stefan Taruhan
sumber
2
Jawaban Anda adalah yang paling jelas dan tidak rumit bagi saya sejauh ini. Tapi saya agak bingung. Beberapa orang mengatakan bahwa peluang log yang diprediksikan adalah fungsi linier dan yang lain mengatakan itu adalah fungsi linier . Begitu?! xθ
Jack Twain
1
kemudian juga dengan penjelasan Anda. Bisakah kita mengatakan bahwa predikasi jaringan saraf adalah fungsi linier dari aktivasi lapisan tersembunyi terakhir?
Jack Twain
2
Prediksi log-odds linier dalam dan . Tetapi biasanya kita paling tertarik pada fakta bahwa peluang-log adalah linear dalam , karena ini menyiratkan bahwa batas keputusan linear dalam ruang . θ^xθ^xxx
Stefan Taruhan
3
Saya telah menggunakan definisi bahwa classifier adalah linier jika batas keputusannya adalah linier dalam ruang . Ini tidak sama dengan probabilitas yang diprediksi linear dalam (yang tidak mungkin terlepas dari kasus-kasus sepele, karena probabilitas harus berada di antara 0 dan 1). xx
Stefan Taruhan
3
@ Patah Saya tahu ini sudah tua, tetapi: Regresi logistik memiliki batas keputusan linier. Ouptut itu sendiri tentu saja tidak linier, tetapi logistiknya. Bergantung pada sisi mana garis jatuh, total output akan mendekati (tetapi tidak pernah mencapai) masing-masing 0 atau 1. Dan untuk menambahkan jawaban Stefan Wagners: Kalimat terakhir tidak sepenuhnya benar, jaringan saraf adalah non-linear ketika berisi aktivasi non-linear atau fungsi ouput. Tapi itu bisa linear juga (kalau-kalau tidak ada non-linearitas ditambahkan).
Chris
20

Seperti dicatat oleh Stefan Wagner, batas keputusan untuk pengklasifikasi logistik adalah linear. (Pengklasifikasi membutuhkan input agar dapat dipisahkan secara linear.) Saya ingin memperluas pada matematika untuk ini jika itu tidak jelas.

Batas keputusan adalah himpunan x sehingga

11+eθx=0.5

Sedikit aljabar menunjukkan bahwa ini setara dengan

1=eθx

dan, mengambil log alami dari kedua belah pihak,

0=θx=i=0nθixi

jadi batas keputusannya linear.

Alasan batas keputusan untuk jaringan syaraf tidak linier adalah karena ada dua lapisan fungsi sigmoid dalam jaringan syaraf: satu di setiap node output ditambah fungsi sigmoid tambahan untuk menggabungkan dan ambang batas hasil setiap node output.

Phil Bogle
sumber
2
Sebenarnya, Anda bisa mendapatkan batas keputusan non-linear dengan hanya satu lapisan yang memiliki aktivasi. Lihat contoh standar XOR dengan jaringan umpan-maju 2-lapisan.
James Hirschorn
5

Jika kita memiliki dua kelas, dan , maka kita dapat menyatakan probabilitas bersyarat sebagai, menerapkan teorema Bayes, penyebutnya dinyatakan sebagai .C0C1

P(C0|x)=P(x|C0)P(C0)P(x)
P(C0|x)=P(x|C0)P(C0)P(x|C0)P(C0)+P(x|C1)P(C1)=11+exp(logP(x|C0)P(x|C1)logP(C0)P(C1))
1+eωx

Di bawah kondisi apa yang mengurangi ekspresi pertama menjadi istilah linier ?. Jika Anda mempertimbangkan keluarga eksponensial (bentuk kanonik untuk distribusi eksponensial seperti Gauß atau Poisson), maka Anda akhirnya memiliki bentuk linier,

P(x|Ci)=exp(θixb(θi)a(ϕ)+c(x,ϕ))
logP(x|C0)P(x|C1)=[(θ0θ1)xb(θ0)+b(θ1)]/a(ϕ)

Perhatikan bahwa kami berasumsi bahwa kedua distribusi milik keluarga yang sama dan memiliki parameter dispersi yang sama. Tetapi, dengan asumsi itu, regresi logistik dapat memodelkan probabilitas untuk seluruh keluarga distribusi eksponensial.

jpmuc
sumber