Saya mencoba menerapkan algoritma di mana diberikan gambar dengan beberapa objek pada tabel bidang, yang diinginkan adalah output dari masker segmentasi untuk setiap objek. Tidak seperti di CNN, tujuannya di sini adalah untuk mendeteksi objek di lingkungan yang tidak dikenal. Apa pendekatan terbaik untuk masalah ini? Juga, apakah ada contoh implementasi yang tersedia secara online?
Sunting: Saya minta maaf, pertanyaan mungkin agak menyesatkan. Apa yang saya maksud dengan "lingkungan asing" adalah bahwa objek mungkin tidak diketahui oleh algoritma. Algoritme seharusnya tidak perlu memahami apa objek itu, tetapi hanya mendeteksi objek. Bagaimana saya harus mendekati masalah ini?
Jawaban:
Menjawab dengan cepat
Mean Shift LSH yang merupakan peningkatan pada dari algoritma Mean Shift yang terkenal di sangat dikenal karena kemampuan segmentasi gambarnyaO ( n ) O ( n2)
Beberapa penjelasan
Jika Anda menginginkan pendekatan tanpa pengawasan untuk mengelompokkan gambar, gunakan algoritma pengelompokan . Faktanya adalah bahwa ada banyak algoritma dengan kompleksitas dan spesifisitas waktu yang berbeda . Ambil yang paling terkenal, Means, itu ada di sangat cepat tetapi Anda harus menentukan berapa banyak kluster yang Anda inginkan yang tidak Anda inginkan dengan menjelajahi gambar yang tidak dikenal tanpa informasi tentang berapa banyak bentuk yang hadir di dalamnya. Selain itu bahkan jika Anda mengira bahwa Anda tahu berapa banyak bentuk yang hadir, kami dapat menganggap bahwa ada bentuk acak yang merupakan titik lain di mana Berarti gagal karena dirancang untuk menemukan cluster elips dan TIDAK.O ( n ) KK O ( n ) K bentuk acak.
Sebaliknya kita memiliki Mean Shift yang dapat menemukan secara otomatis jumlah cluster - yang berguna ketika Anda tidak tahu apa yang Anda cari - dengan bentuk acak .
Tentu saja Anda mengganti parameter dari berarti dengan parameter Mean Shift yang lain yang mungkin sulit dilakukan, tetapi tidak ada alat yang memungkinkan Anda untuk melakukan sihir jika Anda tidak berolahraga untuk melakukan sihir.KK K
Saran untuk pengelompokan segmentasi gambar
Ubah ruang warna Anda dari RGB ke LUV yang lebih baik untuk jarak euclidean.
Berarti Shift LSH lebih lambat tetapi lebih cocok dengan kebutuhan Anda. Itu tetap linier dan juga scalable dengan implementasi yang disebutkan.
PS: Gambar profil saya adalah aplikasi Mean Shift LSH pada diri saya jika itu dapat membantu untuk mengetahui cara kerjanya.
sumber
Anda mungkin perlu melihat karya ini diajukan dan diterima untuk CVPR 2018: Belajar Segmen Setiap Hal
Dalam karya ini, mereka mencoba mengelompokkan semuanya, bahkan objek yang tidak dikenal ke jaringan. Mask R-CNN telah digunakan, dikombinasikan dengan sub-jaringan pembelajaran transfer, mereka mendapatkan hasil yang sangat baik dalam mensegmentasi hampir semuanya.
sumber
State-of-the-art (SOTA) untuk segmentasi gambar adalah Mask-RCNN Facebook .
Meskipun biasanya dilatih pada dataset seperti COCO atau Pascal yang menampilkan objek kehidupan nyata, Anda dapat melatihnya kembali pada dataset pilihan Anda, nyata atau tidak.
Facebook menyediakan implementasi ( Detectron ) di bawah lisensi Apache2. Cobalah!
sumber
Sebenarnya, tugas Anda diawasi.
Segnet
bisa menjadi arsitektur yang baik untuk tujuan Anda yang salah satu implementasinya dapat diakses di sini . SegNet belajar untuk memprediksi label kelas berdasarkan piksel dari pembelajaran yang dilindungi. Oleh karena itu kami memerlukan set data gambar input dengan label kebenaran tanah yang sesuai. Gambar label harus saluran tunggal, dengan masing-masing pixel diberi label dengan kelasnya ... .Juga, lihat Fully Convolutional Networks yang cocok untuk tugas Anda.
Berdasarkan hasil edit dalam pertanyaan, saya menambahkan informasi tambahan. Ada banyak metode yang dapat diterapkan untuk tugas ini. Pada dasarnya yang paling mudah adalah dengan menggunakan label latar belakang dan mengklasifikasikan kelas-kelas yang Anda tidak tahu sebagai latar belakang dengan menggunakan arsitektur yang disebutkan. Dengan melakukannya, Anda akan memiliki label yang dapat memiliki tumpang tindih untuk kelas latar belakang yang kemungkinan merupakan kelemahan dari pendekatan ini, tetapi keuntungannya adalah dalam kasus di mana label terlatih Anda sering digunakan dalam input, Anda dapat memiliki versi arsitektur yang relatif ringan yang mengenali kelas yang tidak dikenal.
sumber
Ini mungkin sesuatu yang Anda cari. Karena Anda meminta segmentasi gambar dan bukan
semantic / instance
segmentasi, saya menganggap Anda tidak memerlukan pelabelan untuk setiap segmen dalam gambar.Metode ini disebut
scene-cut
yang mensegmentasi gambar ke wilayah kelas-agnostik dengan cara yang tidak diawasi. Ini bekerja sangat baik jika lingkungan dalam ruangan berantakan.Tautan kertas: arxiv
Kode: kode
sumber