Algoritma visi komputer (bagaimana ini mungkin?)

9

Baru-baru ini saya menemukan sebuah perusahaan yang telah menciptakan teknologi visi komputer yang mampu mendeteksi mengutil secara otomatis dan memperingatkan penggunanya.

TAUTAN

Menonton beberapa video dan contoh yang diberikan oleh perusahaan telah membuat saya benar-benar bingung dan heran bagaimana mungkin mereka telah mencapai fungsi ini.

Saya mengerti bahwa tidak seorang pun di sini akan dapat memberi tahu saya dengan tepat bagaimana hal ini dapat dicapai tetapi apakah ada yang sadar - dan dapat mengarahkan saya ke - penelitian di bidang ini atau sebagai alternatif mungkin memberikan perincian tentang bagaimana sesuatu seperti ini dapat diimplementasikan atau bimbingan dari mana orang mungkin mulai?

Pemahaman saya adalah algoritma visi komputer bertahun-tahun lagi untuk menjadi canggih ini. Apakah aplikasi semacam ini benar-benar mungkin? Adakah yang mau menebak bagaimana mereka mencapai ini?

Maxim Gershkovich
sumber
2
Ini sepertinya tidak terlalu sulit. Game mendeteksi tabrakan sepanjang waktu di antara objek; mengapa Anda tidak bisa mendeteksi tabrakan antara seseorang dan satu rak barang, dan kemudian membunyikan alarm ketika orang itu berjalan menuju pintu tanpa membayar?
Robert Harvey
Persis. Itu hanya pengenalan objek dan deteksi tabrakan. Kecuali jika mereka menghubungkannya ke pemindai, itu lebih mudah didapat dengan memindahkan objek di atas pemindai tetapi hanya sedikit di atasnya. Objek akan muncul untuk bertabrakan dengan pemindai tetapi pada kenyataannya tidak.
Andrew T Finnell
Lagi pula, tidak ada mekanisme deteksi yang dijelaskan di situs web (sayang, kehilangan keranjang, dan checkout sendiri) yang membutuhkan sesuatu yang bahkan secanggih itu. Mereka memeriksa di area yang sangat terbatas (konter kasir), dan dapat mengecek item yang terlihat di keranjang terhadap apa yang dikatakan oleh pemindai kode batang sebenarnya dipindai.
Robert Harvey
1
Maaf saya bingung. Mari kita ambil contoh sweartarting. Saya punya dua item, satu item biaya rendah, satu item tinggi. Saya meletakkan item berbiaya rendah di bawah item berbiaya tinggi dan memindai. Pada titik itu kita dapat membandingkan apa yang dipindai dalam sistem POS dengan apa yang terlihat pada kamera di tangan kasir tetapi itu membutuhkan sistem untuk dapat "memahami apa yang dimasukkan ke dalam tas" terhadap ratusan ribu potensi item melalui kamera dengan kualitas marjinal. Ini sepertinya sangat rumit. Apa yang saya lewatkan?
Maxim Gershkovich
6
Saya pikir Anda terlalu banyak berasumsi tentang seberapa baik ini bekerja. Saya yakin Anda ada tingkat kesalahan yang layak, dan itu mungkin sangat mudah untuk permainan sistem. Saya melihat ini sebagai lebih dari sistem tipe whistle blower, di mana ia hanya mengidentifikasi tempat-tempat potensial dalam video yang membutuhkan ulasan manusia. Karena itu, ketidakakuratan ditoleransi dengan baik.
chris

Jawaban:

5

Anda salah informasi tentang keadaan seni. Beberapa tahun yang lalu saya bekerja di perusahaan yang membuat sistem seperti itu untuk berbagai keperluan. Salah satunya adalah sistem kontrol jalan keluar bandara yang sangat sukses, yang dapat dengan mudah membedakan antara seseorang berjalan dengan cara yang salah di lorong keluar dan hal-hal seperti bola yang bergerak atau orang yang menuju ke arah yang benar. Mengenali objek dalam sebuah adegan secara real-time tidak mudah, tetapi kami melakukannya pada CPU yang disematkan, bukan pada superkomputer.

Saya tidak melihat apa pun di sana yang tidak dapat dipercaya beberapa tahun yang lalu.

Ross Patterson
sumber
4

Sebenarnya perusahaan ini menggunakan hybrid visi komputer dan tinjauan manual di India. Ini bukan visi komputer murni terutama untuk elemen seperti sayang. Sebenarnya saya kenal seorang pengecer yang memiliki masalah dengan sistem ini bukan karena kinerja sistem yang saya simpan tetapi pengiriman video bandwidth ke India. Pengodean manual ini adalah cara mereka mengurangi kesalahan dan merupakan pemeriksaan teknologi yang khas pada beberapa vendor sekarang.

Mike MacMillan
sumber