Saya telah mencari algoritma pendeteksi penanda untuk digunakan dengan aplikasi berbasis kinect, dan sebagian besar pekerjaan yang saya dapat temukan jelas terfokus pada deteksi fitur pada gambar 'normal'.
Namun, perangkat keras kinect memberikan (pada dasarnya, setelah Anda menyesuaikan) nilai kedalaman 11-bit per piksel.
Gambar kedalaman ini juga memiliki berbagai artefak visual di dalamnya dari bayangan yang dilemparkan di sekitar tepi objek (lihat misalnya perbatasan hitam yang kuat dalam video ini http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ).
Meskipun beberapa teknik penglihatan mesin tradisional (mis. Deteksi tepi) berfungsi baik dengan ini, yang lain tidak, dan sepertinya ada sedikit informasi di internet yang membahas hal ini.
Sebagai contoh sederhana, menggunakan nilai kedalaman membuatnya sepele untuk mendeteksi orientasi blok marker setelah Anda menemukannya.
Jadi, adakah yang melihat diskusi / makalah / dll. Yang mencakup pemrosesan gambar mendalam untuk deteksi fitur?
Adakah yang bisa merekomendasikan algoritma yang baik untuk mendeteksi marker "depth" (secara efektif blok origami alih-alih marker b / w tercetak)?
Apa yang telah saya lakukan sejauh ini adalah eksperimen adhoc menggunakan opencv untuk memproses gambar, tetapi tidak ada yang mendekati stabil atau cukup cepat.
Jika Anda menautkan ke produk visi mesin komersial tanpa semacam percobaan, harap sebutkan dalam jawaban Anda mengapa menurut Anda itu sesuai.
sumber
Jawaban:
Deskriptor fitur 2.5D / 3D favorit saya untuk registrasi dan pengenalan adalah spin image (kertas asli + rincian lebih lanjut dalam tesis Ph.D. dan perangkat lunak yang tersedia dari CMU).
Kemajuan terbaru lainnya (semua dicari on-line untuk algoritma yang sesuai) meliputi: 3D-Sift, Histogram Fitur Titik Cepat, Fitur Radial Normal Aligned (NARF), Penjelas Kernel Kedalaman. Metode yang lebih lama hanya menggunakan properti permukaan seperti kelengkungan dan tepi untuk mengidentifikasi tambalan wilayah.
Mana yang terbaik? Tergantung pada apa yang ingin Anda temukan, sudut pandang invarian, kekacauan tambahan, dll.
sumber
Anda mendapatkan semua kata kunci dengan benar, saya terkejut bahwa Anda benar-benar tidak menemukan artikel terkait saat mencari materi.
Untungnya, saya memiliki akses ke perpustakaan digital IEEE Xplore. Saya tidak memerlukan algoritma khusus ini sebelumnya, tetapi terlihat sangat menarik sehingga berikut adalah beberapa hasil dari pencarian cepat yang saya pikir mungkin relevan (jangan menilai mereka berdasarkan judulnya, lihat abstraknya):
Sayangnya, saya tidak berpikir Anda dapat mengakses makalah ini secara gratis, setidaknya tidak melalui perpustakaan IEEE Xplore. Jika Anda tidak memiliki akses, Anda mungkin dapat bertahan dengan Google scholar , dan ada beberapa database kertas gratis di luar sana (saya menggunakan basis data Mendeley ketika saya belum memiliki akses IEEE). Selain itu, hanya mencari bagian-bagian abstrak atau acak di Google pada makalah terkadang menghasilkan beberapa hasil (Anda mungkin menemukan versi artikel yang hampir diterbitkan sebelumnya yang sudah hampir diterbitkan).
Kueri pencarian yang saya gunakan untuk menemukan makalah yang disebutkan adalah: gambar 3D , gambar kedalaman , kinect . Anda mungkin juga ingin melakukan pemrosesan ketika mencari dua pertanyaan pertama.
Semoga ini bisa membantu! Saya merasa menyesal saya tidak bisa masuk ke subjek lebih, terdengar sangat menarik.
sumber