Dapatkah data yang tidak dapat dipisahkan secara linear dipelajari menggunakan fitur polinomial dengan regresi logistik?

8

Saya tahu bahwa Polynomial Logistic Regressiondengan mudah dapat mempelajari data khas seperti gambar berikut: Saya bertanya-tanya apakah dua data berikut ini juga dapat dipelajari menggunakan atau tidak.
gambar pertama
Polynomial Logistic Regression


masukkan deskripsi gambar di sini
masukkan deskripsi gambar di sini

Saya kira saya harus menambahkan lebih banyak penjelasan. Asumsikan bentuk pertama. Jika kita menambahkan fitur polinomial tambahan untuk input 2-D ini (seperti x1 ^ 2 ...) kita dapat membuat batas keputusan yang dapat memisahkan data. Misalkan saya memilih X1 ^ 2 + X2 ^ 2 = b. Ini dapat memisahkan data. Jika saya menambahkan fitur tambahan saya akan mendapatkan bentuk bergelombang (mungkin lingkaran bergelombang atau elipsis bergelombang) tetapi masih tidak dapat memisahkan data grafik kedua, bukan?

Media
sumber
1
Mungkin tergelincir, tetapi Anda secara implisit bertanya tentang klasifikasi, bukan regresi ...
Emre
1
@Emre sebenarnya saya bertanya tentang regresi logistik polinomial, Anda benar :)
Media
1
Di mana Anda membaca tentang itu? Apakah maksud Anda regresi logistik multinomial ?
Emre
1
Saya tidak tahu tentang statika , tetapi saya belum pernah mendengar tentang regresi logistik polinomial dalam statistik . Saya pikir Anda harus melihat ke regresi logistik kernel jika Anda tertarik pada batas kelas nonlinier.
Emre
1
Tidak ada referensi untuk regresi logistik polinomial di sana. Atau jenis regresi logistik lainnya.
Emre

Jawaban:

7

Ya, secara teori , perluasan polinomial ke regresi logistik dapat mendekati batas klasifikasi sewenang-wenang. Itu karena polinomial dapat mendekati fungsi apa pun (setidaknya jenis yang berguna untuk masalah klasifikasi), dan ini dibuktikan oleh teorema Stone-Weierstrass .

Apakah perkiraan ini praktis untuk semua bentuk batas adalah masalah lain. Anda mungkin lebih baik mencari fungsi dasar lainnya (misalnya deret Fourier, atau jarak radial dari titik contoh), atau pendekatan lain seluruhnya (misalnya SVM) ketika Anda mencurigai bentuk batas kompleks di ruang fitur. Masalah dengan menggunakan polinomial orde tinggi adalah bahwa jumlah fitur polinomial yang perlu Anda gunakan tumbuh secara eksponensial dengan tingkat polinomial dan jumlah fitur asli.

Anda bisa membuat polinomial untuk mengklasifikasikan XOR. 510xy mungkin awal jika Anda gunakan 1 dan 1 sebagai input biner, ini memetakan input (x,y) untuk output sebagai berikut:

(1,1):5(1,1):5(1,1):5(1,1):5

Melewati itu ke dalam fungsi logistik akan memberi Anda nilai cukup dekat ke 0 dan 1.

Mirip dengan dua area lingkaran Anda adalah kurva angka delapan sederhana:

a(x2y2bx4+c)

dimana a,b dan cadalah konstanta. Anda bisa mendapatkan dua area tertutup terpisah yang didefinisikan dalam classifier Anda - di sisi berlawanan dariy sumbu, dengan memilih a,b dan csecara tepat. Misalnya cobaa=1,b=0.05,c=1 untuk mendapatkan fungsi yang jelas memisahkan menjadi dua puncak x=3 dan x=3:

dua kelas yang terpisah

Plot yang ditampilkan adalah dari alat online di academo.org , dan untukx2y20.05x41>0 - kelas positif ditampilkan sebagai nilai 1 dalam plot di atas, dan biasanya di mana 11+ez>0.5 dalam regresi logistik atau adil z>0

Pengoptimal akan menemukan nilai terbaik, Anda hanya perlu menggunakannya 1,x2,y2,x4 sebagai istilah ekspansi Anda (meskipun perhatikan istilah spesifik ini terbatas untuk mencocokkan bentuk dasar yang sama yang tercermin di sekitar y axis - dalam praktiknya Anda ingin memiliki beberapa istilah hingga polinomial tingkat keempat untuk menemukan lebih banyak grup yang terpisah secara acak dalam sebuah classifier).

Faktanya, setiap masalah yang dapat Anda selesaikan dengan jaringan saraf yang dalam - dari kedalaman apa pun - Anda dapat menyelesaikannya dengan struktur datar menggunakan regresi linier (untuk masalah regresi) atau regresi logistik (untuk masalah klasifikasi). Ini "hanya" masalah menemukan ekspansi fitur yang tepat. Perbedaannya adalah bahwa jaringan saraf akan berusaha untuk menemukan ekspansi fitur yang bekerja secara langsung, sementara rekayasa fitur menggunakan polinomial atau skema lain adalah kerja keras dan tidak selalu jelas bagaimana memulai: Pikirkan misalnya bagaimana Anda dapat membuat perkiraan polinomial untuk apa yang neural konvolusional jaringan lakukan untuk gambar? Sepertinya tidak mungkin. Mungkin juga sangat tidak praktis. Tapi itu memang ada.

Neil Slater
sumber
Anda yakin dengan paragraf pertama? bentuk non-cembung benar-benar dapat dipelajari menggunakan polinomial?
Media
1
@ NeilSlater Saya memecahkan lingkaran di atas. XOR juga mudah: cukup tambahkan istilah untuk "xy".
Emre
1
@Emre: Terima kasih. Saya pikir untuk menjadi murni, |x|tidak diperbolehkan, karena itu adalah non-linearitas yang berbeda.
Neil Slater
1
Mengapa berhenti di polinomial? Bukannya kita mengambil turunan dari input, jadi gunakan fungsi apa pun yang Anda inginkan.
Emre
1
@ Ya, saya sudah menyarankan dalam pertanyaan bahwa fungsi-fungsi lain bisa berguna. Namun, saya pikir titik OP menggunakan istilah "Regresi Logistik Polinomial" adalah bahwa ia dimaksudkan untuk hanya menggunakan polinomial. Saya pikir ada beberapa perpustakaan yang akan melakukan perluasan fitur polinomial otomatis untuk digunakan dengan pengoptimal linier.
Neil Slater