Membaca beberapa makalah tentang odometri visual, banyak menggunakan kedalaman terbalik. Apakah itu hanya kebalikan matematis kedalaman (artinya 1 / d) atau apakah itu mewakili sesuatu yang lain. Dan apa keuntungan menggunakannya?
slam
computer-vision
odometry
Mehdi
sumber
sumber
Parameterisasi kedalaman terbalik mewakili jarak tengara, d, dari kamera persis seperti yang dikatakannya, sebanding dengan 1 / d dalam algoritma estimasi. Rasional di balik pendekatan ini adalah bahwa, pendekatan penyaringan seperti extended Kalman filter (EKF) membuat asumsi bahwa kesalahan yang terkait dengan fitur adalah Gaussian.
Dalam pengaturan odometri visual, kedalaman tengara diperkirakan dengan melacak fitur terkait pada beberapa rangkaian bingkai dan kemudian menggunakan paralaks yang diinduksi. Namun untuk fitur jauh (relatif terhadap perpindahan kamera) paralaks yang dihasilkan akan kecil, dan yang terpenting distribusi kesalahan yang terkait dengan kedalaman sangat memuncak mendekati kedalaman minimum dengan ekor panjang (yaitu tidak dimodelkan dengan baik melalui Distribusi Gaussian). Untuk melihat contoh harus merujuk pada Gambar. 7 di kertas Civera et al. (Disebutkan oleh @freakpatrol), atau Gambar. 4 dari Fallon et al. ICRA 2012 .
Dengan mewakili kedalaman terbalik (yaitu 1 / d) kesalahan ini menjadi Gaussian. Lebih jauh lagi itu memungkinkan mewakili titik yang sangat jauh misalnya titik tak terhingga.
sumber
Makalah Davison yang memperkenalkan metode ini cukup mudah dimengerti:
Parameterisasi Kedalaman Terbalik untuk SLAM Bermata oleh Javier Civera, Andrew J. Davison, dan JM Martınez Montiel DOI: 10.1109 / TRO.2008.2003276
sumber
Selain alasan yang disebutkan dalam jawaban lain tentang pengkondisian numerik kedalaman terbalik, alasan utama untuk istilah ini muncul dalam literatur khusus odometri visual adalah cara kedalaman dihitung dari penglihatan stereo: Setelah perbaikan, informasi 3D disimpulkan dari jarak dalam X antara titik muncul di gambar kedua kamera.
Kedalaman,Z , kemudian dihitung dari disparitas, d , sebagai Z= fBd dimana f dan B masing-masing adalah focal length (dalam pixel) dan baseline kamera (dalam meter). Jadi, bekerja dalam ruang kedalaman terbalik membuat Anda juga berada dalam ruang disparitas, kuantitas langsung diperkirakan, dan menjadi lebih mudah untuk bekerja dengan distribusi atau kesalahan dalam kuantitas itu.
sumber