Apakah ada algoritma visi komputer yang secara khusus menargetkan gambar dalam?

9

Saya telah mencari algoritma pendeteksi penanda untuk digunakan dengan aplikasi berbasis kinect, dan sebagian besar pekerjaan yang saya dapat temukan jelas terfokus pada deteksi fitur pada gambar 'normal'.

Namun, perangkat keras kinect memberikan (pada dasarnya, setelah Anda menyesuaikan) nilai kedalaman 11-bit per piksel.

Gambar kedalaman ini juga memiliki berbagai artefak visual di dalamnya dari bayangan yang dilemparkan di sekitar tepi objek (lihat misalnya perbatasan hitam yang kuat dalam video ini http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ).

Meskipun beberapa teknik penglihatan mesin tradisional (mis. Deteksi tepi) berfungsi baik dengan ini, yang lain tidak, dan sepertinya ada sedikit informasi di internet yang membahas hal ini.

Sebagai contoh sederhana, menggunakan nilai kedalaman membuatnya sepele untuk mendeteksi orientasi blok marker setelah Anda menemukannya.

Jadi, adakah yang melihat diskusi / makalah / dll. Yang mencakup pemrosesan gambar mendalam untuk deteksi fitur?

Adakah yang bisa merekomendasikan algoritma yang baik untuk mendeteksi marker "depth" (secara efektif blok origami alih-alih marker b / w tercetak)?

Apa yang telah saya lakukan sejauh ini adalah eksperimen adhoc menggunakan opencv untuk memproses gambar, tetapi tidak ada yang mendekati stabil atau cukup cepat.

Jika Anda menautkan ke produk visi mesin komersial tanpa semacam percobaan, harap sebutkan dalam jawaban Anda mengapa menurut Anda itu sesuai.

Doug
sumber
Ada banyak makalah dan program untuk ini. Maaf tidak dapat menjawab lebih detail, pada bandwidth rendah. Lihat aplikasi RGBDemo, itu termasuk pengenal objek. Juga, PointCloud Library (PCL), ROS, OpenCV, untuk perangkat lunak, dan mungkin Google Cendekia untuk makalah. Anda menyebutkan OpenCV tidak memuaskan bagi Anda, tetapi PCL dan RGBDemo mungkin.
Saya tidak mencari implementasi demo yang memamerkan kinect, atau demo PC yang menunjukkan cara membuat model 3d dari kinect atau toolkit pemrosesan gambar (mis. Opencv). Saya mencari algoritme untuk pengenalan fitur berdasarkan gambar yang dalam.
RGBDemo mengimplementasikan algoritma tersebut. Baca kode atau referensi untuk kode tersebut.

Jawaban:

8

Deskriptor fitur 2.5D / 3D favorit saya untuk registrasi dan pengenalan adalah spin image (kertas asli + rincian lebih lanjut dalam tesis Ph.D. dan perangkat lunak yang tersedia dari CMU).

Kemajuan terbaru lainnya (semua dicari on-line untuk algoritma yang sesuai) meliputi: 3D-Sift, Histogram Fitur Titik Cepat, Fitur Radial Normal Aligned (NARF), Penjelas Kernel Kedalaman. Metode yang lebih lama hanya menggunakan properti permukaan seperti kelengkungan dan tepi untuk mengidentifikasi tambalan wilayah.

Mana yang terbaik? Tergantung pada apa yang ingin Anda temukan, sudut pandang invarian, kekacauan tambahan, dll.

tiluki
sumber
7

Anda mendapatkan semua kata kunci dengan benar, saya terkejut bahwa Anda benar-benar tidak menemukan artikel terkait saat mencari materi.

Untungnya, saya memiliki akses ke perpustakaan digital IEEE Xplore. Saya tidak memerlukan algoritma khusus ini sebelumnya, tetapi terlihat sangat menarik sehingga berikut adalah beberapa hasil dari pencarian cepat yang saya pikir mungkin relevan (jangan menilai mereka berdasarkan judulnya, lihat abstraknya):

Sayangnya, saya tidak berpikir Anda dapat mengakses makalah ini secara gratis, setidaknya tidak melalui perpustakaan IEEE Xplore. Jika Anda tidak memiliki akses, Anda mungkin dapat bertahan dengan Google scholar , dan ada beberapa database kertas gratis di luar sana (saya menggunakan basis data Mendeley ketika saya belum memiliki akses IEEE). Selain itu, hanya mencari bagian-bagian abstrak atau acak di Google pada makalah terkadang menghasilkan beberapa hasil (Anda mungkin menemukan versi artikel yang hampir diterbitkan sebelumnya yang sudah hampir diterbitkan).

Kueri pencarian yang saya gunakan untuk menemukan makalah yang disebutkan adalah: gambar 3D , gambar kedalaman , kinect . Anda mungkin juga ingin melakukan pemrosesan ketika mencari dua pertanyaan pertama.

Semoga ini bisa membantu! Saya merasa menyesal saya tidak bisa masuk ke subjek lebih, terdengar sangat menarik.

Penelope
sumber
@mankoff hanya dari abstrak, saya hanya melihat pekerjaan berkonsentrasi pada pelacakan, dan tampaknya berkonsentrasi pada menggunakan informasi langsung dengan deteksi fitur yang tidak banyak. Tapi kemudian, saya hanya membaca abstraksi, jadi tidak yakin.
Googling judul makalah sudah cukup untuk menemukan PDF untuk beberapa makalah tersebut. Sumber bagus lainnya adalah CiteSeer: citeseerx.ist.psu.edu/index Terima kasih atas daftar makalahnya!
Rethunk