Bagaimana cara menghitung jumlah fitur berdasarkan resolusi gambar?

18

Baru saja membahas Hipotesis Non-linear Neural Netowrks Andrew Ng, dan kami memiliki pertanyaan pilihan ganda untuk menentukan jumlah fitur untuk gambar resolusi 100x100 dari intensitas grescale .

Dan jawabannya adalah 50 juta, x10 75107

Namun, sebelumnya untuk 50 x 50 piksel, gambar skala abu-abu. jumlah fitur adalah 50x50 (2500)

Mengapa harus x bukannya ?10 7 10 , 000510710,000

Namun dia mengatakan termasuk semua istilah kuadratik ( ) sebagai fiturxsayaxj

Misalkan Anda belajar mengenali mobil dari gambar 100 × 100 piksel (skala abu-abu, bukan RGB). Biarkan fitur menjadi nilai intensitas piksel. Jika Anda melatih regresi logistik termasuk semua istilah kuadratik ( ) sebagai fitur, tentang berapa banyak fitur yang akan Anda miliki?xsayaxj

dan pada slide sebelumnya tentang 100x100, bahwa fitur kuadratik ( x ) = 3 juta fitur, tapi saya masih tidak bisa meletakkan jari pada koneksi.x jxsayaxj

Iancovici
sumber

Jawaban:

16

Mungkin kasus yang lebih sederhana akan membuat segalanya lebih jelas. Katakanlah kita memilih sampel piksel 1x2 bukannya 100x100.

Contoh Pixel Dari Gambar

+----+----+
| x1 | x2 |
+----+----+

Bayangkan ketika merencanakan set pelatihan kami, kami perhatikan bahwa itu tidak dapat dipisahkan dengan mudah dengan model linier, jadi kami memilih untuk menambahkan istilah polinomial agar lebih sesuai dengan data.

Katakanlah, kami memutuskan untuk membuat polinomial dengan memasukkan semua intensitas piksel, dan semua kelipatan yang mungkin dapat dibentuk darinya.

Karena matriks kita kecil, mari kita sebutkan:

x1, x2, x12, x22, x1×x2, x2×x1

Menafsirkan urutan fitur di atas dapat melihat bahwa ada pola. Dua istilah pertama, grup 1, adalah fitur yang hanya terdiri dari intensitas pikselnya. Dua istilah berikut setelah itu, grup 2, adalah fitur yang terdiri dari kuadrat intensitasnya. Dua istilah terakhir, grup 3, adalah produk dari semua kombinasi intensitas piksel berpasangan (dua).

grup 1:x1, x2

grup 2:x12, x22

grup 3:x1×x2, x2×x1

Tapi tunggu dulu, ada masalah. Jika Anda melihat istilah grup 3 dalam urutan ( dan ) Anda akan melihat bahwa mereka sama. Ingat contoh perumahan kami. Bayangkan memiliki dua fitur x1 = cuplikan persegi, dan x2 = cuplikan persegi, untuk rumah yang sama ... Itu tidak masuk akal! Oke, jadi kita perlu menyingkirkan fitur duplikat, katakanlah sewenang-wenang . Sekarang kita dapat menulis ulang daftar fitur grup tiga sebagai:x 2 × x 1 x 2 × x 1x1×x2x2×x1x2×x1

grup 3:x1×x2

Kami menghitung fitur di ketiga grup dan mendapatkan 5.

Tapi ini adalah contoh mainan. Mari kita dapatkan formula umum untuk menghitung jumlah fitur. Mari kita gunakan grup fitur asli kami sebagai titik awal.

ssayazegrHaikamuhal1+ssayazegrHaikamuhal2+ssayazegrHaikamuhal3=m×n+m×n+m×n=3×m×n

Ah! Tetapi kami harus menyingkirkan produk duplikat di grup 3.

Jadi untuk menghitung fitur-fitur untuk grup 3 kita perlu cara menghitung semua produk berpasangan yang unik dalam matriks. Yang dapat dilakukan dengan koefisien binomial, yang merupakan metode untuk menghitung semua kemungkinan subkelompok unik ukuran k dari kelompok ukuran yang sama atau lebih besar n. Jadi untuk menghitung fitur dalam grup 3, hitung .C(m×n,2)

Jadi rumus umum kami adalah:

m×n+m×n+C(m×n,2)=2m×n+C(m×n,2)

Mari kita gunakan untuk menghitung jumlah fitur dalam contoh mainan kami:

2×1×2+C(1×2,2)=4+1=5

Itu dia!

Anwar A. Ruff
sumber
2
Semoga penjelasan ini diberikan dalam kuliah ini!
Ian Walker-Sperber
Saya bertanya-tanya bagaimana kita bisa mengetahui hal ini dalam kursus tanpa dijelaskan
Mohammed Noureldin
6

Jika Anda menggunakan semua fitur linear dan kuadratik, jumlah totalnya seharusnya:

100*100 + 100*100 + C(100*100,2) = 50015000
10000   + 10000   + 49995000     = 50015000
xi         xi^2       xixj
lennon310
sumber
1
Bisakah Anda jelaskan sedikit lebih jauh? maksudmu xi + xi ^ 2 + xixi? Apakah xi = 100, dan xj = 100? mengapa xi dan xi ^ 2 keduanya 100 * 100? Apa itu C (100 * 100,2)?
Iancovici
4
(1) ada total 100 * 100 piksel, jika Anda menggunakan intensitas sebagai fitur, akan ada 100 * 100 fitur secara total, itu xi; dan (ii) Anda juga dapat menggunakan kerapatan daya sebagai fitur, yaitu (xi, xi) atau xi. ^ 2, secara total masih 100 * 100; akhirnya (iii) jika Anda menggunakan korelasi antara dua piksel, akan ada total C pasang piksel, yaitu (xi, xj), C adalah kombinasi dalam matematika ( mathworld.wolfram.com/Combination.html )
lennon310
Terima kasih, satu pertanyaan terakhir adalah mengapa xi = xi ^ 2 dalam konteks ini?
Iancovici
Saya menggunakan xi untuk merepresentasikan piksel tunggal, dan xi ^ 2 berarti menggunakan pasangan piksel yang sama (xi, xi). Jumlah piksel tunggal sama dengan pasangan piksel yang sama. Ini tidak ada hubungannya dengan intensitas piksel. Maaf bila membingungkan.
lennon310
Pertanyaan yang sama, beberapa tahun kemudian. Tidakkah seharusnya kita memperhitungkan juga nilai intensitas yang dimungkinkan (dari 0 hingga 255)?
albus_c
0

x2

Opepunde Adepoju
sumber
2
25002/2350
0

@whuber 50 juta datang ketika Anda memiliki gambar 100 * 100 piksel. di mana kuadrat (100 * 100) = 100000000 (10 juta) dan kuadrat (100 * 100) / 2 = 5 juta. Semoga jawaban ini.

Tahir Ahmad
sumber
Ini adalah tanggapan terhadap komentar dan bukan jawaban untuk pertanyaan ini.
Michael R. Chernick