Ini adalah ekspresi matematika untuk deteksi sudut Harris:
Tetapi saya memiliki keraguan sebagai berikut:
- Apa signifikansi fisik dari dan ? Banyak referensi mengatakan itu adalah besarnya dengan yang jendela bergeser. Jadi berapa jendela yang digeser? Satu piksel atau dua piksel?
- Apakah penjumlahan atas posisi piksel tertutup oleh jendela?
- Dengan asumsi hanya , adalah intensitas piksel tunggal pada atau penjumlahan dari intensitas di dalam jendela dengan pusat di ?
- Menurut wiki mereka mengatakan gambar adalah 2D, dilambangkan dengan I dan kemudian meminta untuk mempertimbangkan tambalan gambar di atas area , kemudian menggunakan notasi
Saya menemukan itu membingungkan untuk memahami penjelasan matematis. Adakah yang punya ide?
image-processing
opencv
linear-algebra
rotating_image
sumber
sumber
Jawaban:
Arti formula itu sangat sederhana. Bayangkan Anda mengambil dua area kecil berukuran sama dari sebuah gambar, yang biru dan merah:
Fungsi jendela sama dengan 0 di luar persegi panjang merah (untuk kesederhanaan, kita dapat menganggap jendela hanya konstan di dalam persegi panjang merah). Jadi fungsi jendela memilih piksel mana yang ingin Anda lihat dan memberikan bobot relatif untuk setiap piksel. (Paling umum adalah jendela Gaussian, karena itu rotasi simetris, efisien untuk menghitung dan menekankan piksel di dekat pusat jendela.) Kotak biru bergeser oleh (u, v).
Selanjutnya Anda menghitung jumlah selisih kuadrat antara bagian gambar yang ditandai merah dan biru, yaitu Anda mengurangkannya piksel demi piksel, kuadratkan perbedaannya dan jumlah hasilnya (dengan asumsi, untuk kesederhanaan bahwa jendela = 1 di area yang kita cari di). Ini memberi Anda satu nomor untuk setiap kemungkinan (u, v) -> E (u, v).
Mari kita lihat apa yang terjadi jika kita menghitungnya untuk nilai u / v yang berbeda:
Pertahankan pertama v = 0:
Ini seharusnya tidak mengejutkan: Perbedaan antara bagian-bagian gambar paling rendah ketika offset (u, v) di antara mereka adalah 0. Ketika Anda meningkatkan jarak antara dua tambalan, jumlah perbedaan kuadrat juga meningkat.
Menjaga Anda = 0:
Plot terlihat mirip, tetapi jumlah perbedaan kuadrat antara dua bagian gambar jauh lebih kecil ketika Anda menggeser persegi panjang biru ke arah tepi.
Alur lengkap E (u, v) terlihat seperti ini:
Plotnya terlihat seperti "ngarai": Hanya ada sedikit perbedaan jika Anda menggeser gambar ke arah ngarai. Itu karena tambalan gambar ini memiliki orientasi dominan (vertikal).
Kita dapat melakukan hal yang sama untuk patch gambar yang berbeda:
Di sini, plot E (u, v) terlihat berbeda:
Tidak peduli ke arah mana Anda menggeser tambalan, selalu terlihat berbeda.
Jadi bentuk fungsi E (u, v) memberi tahu kita sesuatu tentang tambalan gambar
Biasanya, Anda tidak menghitung E (u, v) sama sekali. Anda hanya tertarik pada bentuknya di lingkungan (u, v) = (0,0). Jadi Anda hanya ingin ekspansi Taylor dari E (u, v) dekat (0,0), yang sepenuhnya menggambarkan "bentuk" itu.
Secara matematis, akan lebih elegan untuk membiarkan rentang penjumlahan ke semua piksel. Secara praktis, tidak ada gunanya menjumlahkan piksel di mana jendelanya 0.
sumber