Ketepatan algoritma Visi Komputer

8

Katakanlah tugasnya adalah menentukan posisi elemen pada gambar. Hal pertama yang sangat penting adalah deteksi objek yang benar, kemudian beberapa algoritma posisi penghitungan digunakan (untuk analisis gumpalan gumpalan). Semuanya tergantung pada banyak hal (kebenaran deteksi, algoritma yang digunakan, dll.)

Mari kita asumsikan kita memiliki gambar yang dikalibrasi dan tahu kesalahan yang diberikan oleh kalibrasi. Apa metode untuk menghitung presisi andal algoritma penglihatan komputer (dan mesin)? Bisakah itu dilakukan secara analitis atau hanya dengan eksperimen dan tes?

Alamat tambahan kasus ketika kami mendeteksi posisi elemen dan juga masalah penglihatan komputer lainnya.

Saya ingin mendapatkan referensi untuk masalah yang terkait dengan visi komputer / mesin terutama deteksi posisi elemen dan menyajikan beberapa perhitungan yang benar baik secara analitis atau pendekatan eksperimental untuk menunjukkan precisi ini.

Juga saran bagaimana meningkatkan pertanyaan ini disambut.

krzych
sumber

Jawaban:

4

Misalnya, Hartley & Zisserman menyarankan untuk menggunakan prakondisi sebelum estimasi homografi, karena mengambil invers matriks langsung dapat menyebabkan kesalahan besar atau ketidakstabilan. Ini berlaku untuk setiap metode numerik yang bekerja dengan invers matriks.

Algoritma pendeteksian fitur sering menggunakan perkiraan sub-pixel dari lokasi titik minat.

Sebagian besar buku yang membahas metode numerik juga membahas analisis kestabilannya.

Terkadang Anda perlu melakukan beberapa statistik untuk menganalisis ketepatan dan ketepatan penduga Anda (baik itu penduga terkecil atau penduga kemungkinan maksimum). Ini berguna dalam algoritme seperti RANSAC , yang menangani outlier. Anda juga ingin tahu, seberapa baik transformasi yang diperkirakan sesuai dengan data Anda dan mungkin membuang hasil yang terlalu tidak akurat.

Ketika bekerja dengan beda hingga atau melakukan beberapa penyaringan, sedikit Gaussian blurring dilakukan untuk menghilangkan noise, yang jika tidak akan menyebabkan kesalahan besar pada turunan kedua.

Beberapa masalah dalam penglihatan komputer tidak benar. Suatu metode regularisasi (seperti regularisasi Tikchonov) diperlukan untuk menyelesaikannya. Contoh di mana ini diperlukan termasuk komputasi difusi anisotropik.

Libor
sumber
Jadi ini berlaku ketika kami telah mendeteksi beberapa fitur dan mencocokkannya dengan fitur model dengan statistik (dan pencocokan ini memberikan kesalahan yang dapat kami hitung). Bagaimana dengan kesalahan deteksi fitur komputasi. Sebagai contoh jika fitur gumpalan diekstraksi oleh thresholding?
krzych
Saya pikir Anda tidak dapat menghitung "kesalahan deteksi" hanya diberikan gambar. Perlu ada beberapa konteks di mana Anda dapat mengatakan bahwa fitur tersebut salah.
Libor
Persis tapi apa hubungannya. Bagaimana cara merancang beberapa tes untuk mengetahui kebenaran deteksi fitur?
krzych
2
Seperti dicatat H&Z dalam buku mereka: "Ini masalah ayam dan telur ..." Kita tidak bisa mengatakan fitur mana yang "baik" dan mana yang "buruk" tanpa mencocokkannya terlebih dahulu. Ada beberapa perkembangan dalam mendesain deskriptor fitur sehingga cocok dengan dataset yang lebih besar. Diberikan pengukuran 'kualitas' deskriptor, Anda dapat membedakan fitur yang tidak mungkin cocok.
Libor
Tetapi harus ada beberapa metode untuk mengevaluasi kebenaran seluruh sistem. Saya pikir itu sangat penting untuk aplikasi penglihatan mesin terutama ketika kita berbicara tentang pemosisian elemen. Seperti yang saya katakan dalam pertanyaan saya juga tertarik pada beberapa cara menguji kebenaran ini.
krzych
4

Ini tidak menjawab seluruh pertanyaan, tetapi membahas sebagian dari apa yang ditanyakan OP.

Itu hanya bisa dilakukan secara eksperimental. Untuk melakukannya secara analitik akan memerlukan informasi tentang apa yang seharusnya dikembalikan oleh algoritma . Tetapi untuk mengetahui hal itu, Anda perlu membandingkan algoritma penglihatan komputer yang selalu benar untuk membandingkan (dan juga deskripsi analitis rinci dari gambar yang diuji terhadap). Solusi analitis membutuhkan pengetahuan tentang kebenaran dasar yang analitis daripada yang dihasilkan sendiri berdasarkan kasus per kasus. Tetapi kami tidak memiliki cara analitis untuk menghasilkan kebenaran dasar - itulah yang kami coba kembangkan.

Karena itu hanya dapat dilakukan secara eksperimental, Anda mungkin ingin melihat google scholar. Jika Anda mencari orang lokasi akan ada banyak kertas yang didedikasikan untuk mencari seseorang, atau bagian dari orang seperti kepala atau tangan. Lokasi mobil juga akan memiliki banyak perhatian khusus. Objek lain hanya akan menginginkan algoritma generik.

John Robertson
sumber
Beberapa referensi dapat meningkatkan jawaban ini.
krzych