Mungkin kasus yang lebih sederhana akan membuat segalanya lebih jelas. Katakanlah kita memilih sampel piksel 1x2 bukannya 100x100.
Contoh Pixel Dari Gambar
+----+----+
| x1 | x2 |
+----+----+
Bayangkan ketika merencanakan set pelatihan kami, kami perhatikan bahwa itu tidak dapat dipisahkan dengan mudah dengan model linier, jadi kami memilih untuk menambahkan istilah polinomial agar lebih sesuai dengan data.
Katakanlah, kami memutuskan untuk membuat polinomial dengan memasukkan semua intensitas piksel, dan semua kelipatan yang mungkin dapat dibentuk darinya.
Karena matriks kita kecil, mari kita sebutkan:
x1, x 2, x 21, x 22, x 1× x2, x 2× x1
Menafsirkan urutan fitur di atas dapat melihat bahwa ada pola. Dua istilah pertama, grup 1, adalah fitur yang hanya terdiri dari intensitas pikselnya. Dua istilah berikut setelah itu, grup 2, adalah fitur yang terdiri dari kuadrat intensitasnya. Dua istilah terakhir, grup 3, adalah produk dari semua kombinasi intensitas piksel berpasangan (dua).
grup 1:x1, x 2
grup 2:x21, x 22
grup 3:x1× x2, x 2× x1
Tapi tunggu dulu, ada masalah. Jika Anda melihat istilah grup 3 dalam urutan ( dan ) Anda akan melihat bahwa mereka sama. Ingat contoh perumahan kami. Bayangkan memiliki dua fitur x1 = cuplikan persegi, dan x2 = cuplikan persegi, untuk rumah yang sama ... Itu tidak masuk akal! Oke, jadi kita perlu menyingkirkan fitur duplikat, katakanlah sewenang-wenang . Sekarang kita dapat menulis ulang daftar fitur grup tiga sebagai:x 2 × x 1 x 2 × x 1x1× x2x2× x1x2× x1
grup 3:x1× x2
Kami menghitung fitur di ketiga grup dan mendapatkan 5.
Tapi ini adalah contoh mainan. Mari kita dapatkan formula umum untuk menghitung jumlah fitur. Mari kita gunakan grup fitur asli kami sebagai titik awal.
s i ze gr o u p 1 + s i ze gr o u p 2 + s i ze gr o u p 3 = m × n + m × n + m × n = 3 × m × n
Ah! Tetapi kami harus menyingkirkan produk duplikat di grup 3.
Jadi untuk menghitung fitur-fitur untuk grup 3 kita perlu cara menghitung semua produk berpasangan yang unik dalam matriks. Yang dapat dilakukan dengan koefisien binomial, yang merupakan metode untuk menghitung semua kemungkinan subkelompok unik ukuran k dari kelompok ukuran yang sama atau lebih besar n. Jadi untuk menghitung fitur dalam grup 3, hitung .C( m × n , 2 )
Jadi rumus umum kami adalah:
m × n + m × n + C( m × n , 2 ) = 2 m × n + C( m × n , 2 )
Mari kita gunakan untuk menghitung jumlah fitur dalam contoh mainan kami:
2 × 1 × 2 + C( 1 × 2 , 2 ) = 4 + 1 = 5
Itu dia!
Jika Anda menggunakan semua fitur linear dan kuadratik, jumlah totalnya seharusnya:
sumber
sumber
@whuber 50 juta datang ketika Anda memiliki gambar 100 * 100 piksel. di mana kuadrat (100 * 100) = 100000000 (10 juta) dan kuadrat (100 * 100) / 2 = 5 juta. Semoga jawaban ini.
sumber