Matematika deteksi titik sudut Harris

23

Ini adalah ekspresi matematika untuk deteksi sudut Harris:

Ini adalah ekspresi matematika untuk deteksi sudut Harris ...

Tetapi saya memiliki keraguan sebagai berikut:

  1. Apa signifikansi fisik dari dan ? Banyak referensi mengatakan itu adalah besarnya dengan yang jendela bergeser. Jadi berapa jendela yang digeser? Satu piksel atau dua piksel?kamuvw
  2. Apakah penjumlahan atas posisi piksel tertutup oleh jendela?
  3. Dengan asumsi hanya , adalah intensitas piksel tunggal pada atau penjumlahan dari intensitas di dalam jendela dengan pusat di ?w(x,y)=1saya(x,y)(x,y)(x,y)
  4. Menurut wiki mereka mengatakan gambar adalah 2D, dilambangkan dengan I dan kemudian meminta untuk mempertimbangkan tambalan gambar di atas area , kemudian menggunakan notasi(x,y)saya(x,y)

Saya menemukan itu membingungkan untuk memahami penjelasan matematis. Adakah yang punya ide?

rotating_image
sumber
2
Lihat kuliah ini di detektor sudut Harris. Sangat jelas: youtube.com/watch?v=P35WsRDnTsU&t=41m12s
Saya menulis posting di blog pribadi saya yang didasarkan pada ceramah di atas. matlabcorner.wordpress.com/2012/11/17/…
Andrey Rubshtein

Jawaban:

31

Arti formula itu sangat sederhana. Bayangkan Anda mengambil dua area kecil berukuran sama dari sebuah gambar, yang biru dan merah:

masukkan deskripsi gambar di sini

Fungsi jendela sama dengan 0 di luar persegi panjang merah (untuk kesederhanaan, kita dapat menganggap jendela hanya konstan di dalam persegi panjang merah). Jadi fungsi jendela memilih piksel mana yang ingin Anda lihat dan memberikan bobot relatif untuk setiap piksel. (Paling umum adalah jendela Gaussian, karena itu rotasi simetris, efisien untuk menghitung dan menekankan piksel di dekat pusat jendela.) Kotak biru bergeser oleh (u, v).

Selanjutnya Anda menghitung jumlah selisih kuadrat antara bagian gambar yang ditandai merah dan biru, yaitu Anda mengurangkannya piksel demi piksel, kuadratkan perbedaannya dan jumlah hasilnya (dengan asumsi, untuk kesederhanaan bahwa jendela = 1 di area yang kita cari di). Ini memberi Anda satu nomor untuk setiap kemungkinan (u, v) -> E (u, v).

Mari kita lihat apa yang terjadi jika kita menghitungnya untuk nilai u / v yang berbeda:

Pertahankan pertama v = 0:

masukkan deskripsi gambar di sini

Ini seharusnya tidak mengejutkan: Perbedaan antara bagian-bagian gambar paling rendah ketika offset (u, v) di antara mereka adalah 0. Ketika Anda meningkatkan jarak antara dua tambalan, jumlah perbedaan kuadrat juga meningkat.

Menjaga Anda = 0:

masukkan deskripsi gambar di sini

Plot terlihat mirip, tetapi jumlah perbedaan kuadrat antara dua bagian gambar jauh lebih kecil ketika Anda menggeser persegi panjang biru ke arah tepi.

Alur lengkap E (u, v) terlihat seperti ini:

masukkan deskripsi gambar di sini

Plotnya terlihat seperti "ngarai": Hanya ada sedikit perbedaan jika Anda menggeser gambar ke arah ngarai. Itu karena tambalan gambar ini memiliki orientasi dominan (vertikal).

Kita dapat melakukan hal yang sama untuk patch gambar yang berbeda:

masukkan deskripsi gambar di sini

Di sini, plot E (u, v) terlihat berbeda:

masukkan deskripsi gambar di sini

Tidak peduli ke arah mana Anda menggeser tambalan, selalu terlihat berbeda.

Jadi bentuk fungsi E (u, v) memberi tahu kita sesuatu tentang tambalan gambar

  • jika E (u, v) mendekati 0 di mana-mana, tidak ada tekstur pada tambalan gambar yang Anda lihat
  • jika E (u, v) berbentuk "ngarai", tambalan memiliki orientasi dominan (ini bisa berupa tepi atau tekstur)
  • jika E (u, v) berbentuk "kerucut", tambalan memiliki tekstur, tetapi tidak memiliki orientasi dominan. Itulah jenis patch yang dicari oleh detektor sudut.

Banyak referensi mengatakan itu adalah besarnya dimana jendela 'w' bergeser ... jadi berapa banyak jendela yang digeser? Satu piksel ... dua piksel?

Biasanya, Anda tidak menghitung E (u, v) sama sekali. Anda hanya tertarik pada bentuknya di lingkungan (u, v) = (0,0). Jadi Anda hanya ingin ekspansi Taylor dari E (u, v) dekat (0,0), yang sepenuhnya menggambarkan "bentuk" itu.

Apakah penjumlahan atas posisi piksel tertutup oleh jendela?

Secara matematis, akan lebih elegan untuk membiarkan rentang penjumlahan ke semua piksel. Secara praktis, tidak ada gunanya menjumlahkan piksel di mana jendelanya 0.

Niki Estner
sumber
thanx a ton Nikie ....
rotating_image
2
Saya tahu Anda akan mendapatkan jawaban yang sangat baik di sini, @rotating_image
karlphillip
thanx karlphillip ..
rotating_image
1
Satu juta upvotes!
Phonon