Diberikan titik data, masing-masing dengan fitur , diberi label sebagai , yang lain dilabeli sebagai . Setiap fitur mengambil nilai dari secara acak (distribusi seragam). Berapa probabilitas bahwa ada hyperplane yang dapat membagi dua kelas?
Mari kita perhatikan kasus yang paling mudah, yaitu .
Jawaban:
Dengan asumsi tidak ada duplikat dalam data.
Jika , probabilitasnya adalah .n≤d+1 Pr=1
Untuk kombinasi lain dari , lihat plot berikut:(n,d)
Saya membuat plot ini mensimulasikan data input dan output seperti yang ditentukan dalam OP. Separabilitas linier didefinisikan sebagai kegagalan konvergensi dalam model regresi logistik, karena efek Hauck-Donner .
Kita dapat melihat probabilitas menurun untuk meningkatkan . Faktanya, kita dapat memasukkan model yang berhubungan dengan ke , dan inilah hasilnya:n n,d p
Kode untuk plot (dalam Julia):
Kode untuk model yang berkaitan dengan (dalam Julia):(n,d) p
sumber