Saya akan menggunakan algoritma transformasi fitur Scale-invariant sebagai contoh di sini. SIFT menciptakan ruang skala berdasarkan skala penyaringan gaussian dari suatu gambar, dan kemudian menghitung perbedaan gaussians untuk mendeteksi titik bunga potensial. Poin-poin ini didefinisikan sebagai minimum lokal dan maksimum di selisih gaussians.
Dikatakan bahwa pendekatan ini adalah skala invarian (di antara invariansi membingungkan lainnya). Kenapa ini? Tidak jelas bagi saya mengapa ini terjadi.
Jawaban:
Istilah "skala invarian" berarti yang berikut di sini. Katakanlah Anda memiliki gambar I , dan Anda telah mendeteksi fitur (alias titik minat) f di beberapa lokasi (x, y) dan pada beberapa tingkat skala s . Sekarang katakanlah Anda memiliki gambar I ' , yang merupakan versi skala I (downsampled, misalnya). Kemudian, jika detektor fitur Anda adalah skala-invarian, Anda harus dapat mendeteksi fitur yang sesuai untuk ' di I' di lokasi yang sesuai (x ', y') dan skala yang sesuai s ' , di mana (x, y, s) dan (x ', y', s ') terkait dengan transformasi skala yang tepat.
Dengan kata lain, jika detektor invarian skala Anda telah mendeteksi titik fitur yang sesuai dengan wajah seseorang, dan kemudian Anda memperbesar atau memperkecil dengan kamera Anda pada adegan yang sama, Anda masih harus mendeteksi titik fitur pada wajah itu.
Tentu saja, Anda juga menginginkan "deskriptor fitur" yang memungkinkan Anda untuk mencocokkan kedua fitur tersebut, yang persis seperti yang diberikan SIFT kepada Anda.
Jadi, dengan risiko membingungkan Anda lebih lanjut, ada dua hal yang berbeda-beda di sini. Salah satunya adalah detektor titik bunga DoG, yang skala-invarian, karena mendeteksi jenis fitur gambar (gumpalan) tertentu terlepas dari skala mereka. Dengan kata lain, detektor DoG mendeteksi gumpalan dengan berbagai ukuran. Hal skala-invarian lainnya adalah deskriptor fitur, yang merupakan histogram orientasi gradien, yang tetap kurang lebih sama untuk fitur gambar yang sama meskipun ada perubahan skala.
By the way, perbedaan Gaussians digunakan di sini sebagai perkiraan untuk filter Laplacian-of-Gaussians.
sumber
Perbedaan gaussians tidak berskala invarian. Skala SIFT (hingga tingkat terbatas) tidak berubah karena mencari ekstremitas DoG di seluruh skala ruang - yaitu skala yang ditemukan dengan DoG ekstrem baik secara spasial dan relatif ke skala tetangga. Karena output DoG diperoleh untuk skala tetap ini (yang bukan merupakan fungsi skala input) hasilnya adalah skala-independen, yaitu skala-invarian.
sumber