Dapatkah Anda membuat daftar beberapa deskriptor skala dan fitur invarian rotasi untuk digunakan dalam deteksi fitur.
Aplikasi ini untuk mendeteksi mobil dan manusia dalam video yang ditangkap oleh UAV, menggunakan multi-classifier.
Sejauh ini saya telah melihat SIFT dan MSER (yang merupakan affine invarian). Saya juga telah melihat LESH, LESH didasarkan pada model energi lokal, tetapi dihitung dengan cara yang tidak invarian rotasi, saya telah mencoba memikirkan cara untuk memanfaatkan energi lokal, untuk membangun invarian rotasi deskriptor fitur, saya baca di sini Apa saja alternatif gratis untuk SIFT / SURF yang dapat digunakan dalam aplikasi komersial? , bahwa "jika Anda menetapkan orientasi ke titik bunga dan memutar tambalan gambar sesuai, Anda mendapatkan invarian rotasi gratis", tetapi tidak tahu apakah ini bahkan pereda atau bagaimana saya bisa menerapkan ini pada masalah saya, bantuan apa pun akan dihargai, terima kasih
Jawaban:
Sejauh alternatif untuk SIFT / SURF pergi, pertanyaan yang Anda tautkan memberikan jawaban yang sangat baik.
Ada dua pertanyaan lagi yang bisa saya baca:
Membangun deskriptor fitur
Ini adalah topik penelitian yang valid. Penjelas fitur yang baik bukanlah sesuatu yang dapat dibangun oleh siapa saja di siang hari. Orang-orang menerbitkan artikel ketika mereka berhasil memodelkan deskriptor fitur dengan properti yang diinginkan. Ini adalah alasan yang saat ini hanya menggunakan sedikit deskriptor canggih, dan itulah yang saya sarankan untuk Anda lakukan: temukan deskriptor fitur yang bagus untuk kebutuhan Anda .
Mencapai invarian rotasi "gratis"
Anda dapat menentukan gradien dominan , atau orientasi pada tambalan gambar (area fitur Anda). Kemudian, putar tambalan gambar sehingga gradien selalu melihat ke arah yang sama, misalnya (ke atas). Misalnya jika Anda memiliki a dan gambar, gradien dominannya masing-masing akan menunjuk ke kiri ( ) dan kanan ( ), dan ketika Anda memutarnya dengan jumlah ini, Anda mendapatkan gambar yang sama.0 - 90 90
|black->gray->white|
|white->gray->black|
Dengan cara ini Anda akan selalu menghitung deskriptor pada tambalan gambar dengan orientasi dominan yang sama (tambalan diputar), dan dengan demikian Anda mencapai invarian rotasi.
sumber
Cara lain untuk mendapatkan invarian rotasi gratis, adalah memilih objek yang invarian rotasi. Misalnya, lingkaran atau cincin tidak sama dengan rotasi.
Extractor fitur : Jalankan deteksi tepi. Untuk setiap lingkungan
NxN
piksel, hitung arah tepi dan besarnya 2D histogram. Temukan semua titik yang memiliki total magnitudo tinggi , dan penyebaran sudut yang tinggi . Hapus semua titik yang tidak memiliki simetri radial.Deskriptor fitur : Temukan pusat setiap objek lingkaran. Karena objeknya melingkar, ia tidak memiliki sudut gradien yang dominan. Semua sudut sama. Dengan demikian, profil radial (jumlah nilai piksel dalam koordinat kutub) adalah deskriptor sudut invarian.
Omong-omong, itulah salah satu alasan mengapa fidusia diproduksi sebagai lingkaran pada papan sirkuit listrik:
sumber
Saya lebih suka melihat ke KAZE / AKAZE, yang berkinerja sama baiknya dengan kecepatan yang signifikan. Kasus deformasi juga dapat ditoleransi. OpenCV baru-baru ini mendapatkan implementasi melalui GSoC 2014. Anda dapat menemukannya di sini .
sumber
Jika Anda memetakan kembali tambalan lokal di sekitar titik fitur ke log-polar koordinat (dengan asal di tempat tujuan), perubahan skala berhubungan dengan terjemahan sepanjang sumbu log-radial, sementara rotasi sesuai dengan terjemahan (dengan wrap-around) sepanjang sumbu sudut. Jika Anda kemudian menghitung transformasi Fourier dua dimensi, terjemahan dalam arah radial dan sudut menjadi pergeseran fase dalam domain frekuensi. Jika Anda kemudian menghitung nilai absolut dari transformasi Fourier, fase menghilang sepenuhnya, dan perubahan skala dan rotasi patch gambar asli menjadi tidak terlalu mencolok. Jadi nilai absolut dari transformasi 2D Fourier dari gambar dalam koordinat log-poolar akan menjadi deskriptor fitur Anda.
Setidaknya dalam teori. Dalam praktiknya, Anda perlu membatasi ekstensi radial tambalan Anda. Ini berarti bahwa Anda perlu memotong sebagian besar data Anda sebelum menghitung transformasi Fourier (yang benar-benar seri Fourier), jadi terjemahan sepanjang arah log-radial dalam koordinat log-polar tidak persis sesuai dengan hanya pergeseran fase dalam domain frekuensi lagi, sehingga metode ini tidak sempurna skala-invarian. Saya menduga bahwa jika Anda menggunakan beberapa fungsi jendela - tanpa diskontinuitas - pada koordinat log-radius dan mengalikannya dengan intensitas warna, masalah ini akan agak dikurangi.
Namun, deskriptor fitur itu harus tetap invarian rotasi sempurna.
Referensi: Skala Invariance tanpa Seleksi Skala
sumber
Anda juga dapat memeriksa FAST dan BRISK .
sumber