Saya mencoba, untuk tujuan pembelajaran saya sendiri, untuk mengembangkan implementasi algoritma yang akan membuat daftar buku, diberi gambar rak buku seperti berikut ini:
Langkah pertama adalah mengiris gambar menjadi masing-masing buku.
Algoritme saya, dalam Mathematica , adalah:
img = ColorConvert[Import["http://i.stack.imgur.com/IaLQk.jpg"], "GrayScale"]
- lakukan deteksi tepi dasar &
hapus teks dan cobalah untuk menjaga garis panjang
edge = DeleteSmallComponents[EdgeDetect[img, 3],Last[ImageDimensions[img]]/5]
kemudian hapus garis horizontal yang tidak diinginkan
lines = Sort[ImageLines[img5] /. {{0., _}, {_, _}} -> Sequence[]] Show[img, Graphics[{Thick, Orange, Line /@ lines}]]
Namun, hasilnya kurang bagus:
Pertanyaan saya adalah:
- Bagaimana saya bisa meningkatkan ini untuk menghasilkan hasil yang lebih baik?
- Apakah ada cara yang lebih cerdas untuk melakukan ini?
- seberapa jauh saya harus memproses gambar untuk meningkatkan akurasi pada fase OCR (nanti)?
- Bagaimana cara menggunakan informasi warna untuk meningkatkan segmentasi?
opencv
computer-vision
image-segmentation
Oren Pinsky
sumber
sumber
Jawaban:
Berikut ini tautan ke makalah penelitian yang mencoba melakukan hal yang sama seperti yang Anda inginkan. Mungkin membantu Anda. menggunakan fitur gambar Juga video keren di youtube
sumber
Metode apa yang Anda gunakan untuk mendeteksi garis? Sudahkah Anda mencoba bereksperimen dengan LSD ?
Berikut adalah hasil dari tes cepat yang saya lakukan menggunakan LSD:
Gambar kedua adalah hasil dengan batasan sudut yang sama tetapi mengabaikan panjang segmen:
Anda dapat mencoba sedikit bermain dengan ini, mencari tahu bagaimana memilih segmen garis terbaik, memperluas mereka ke garis dan mungkin mendapatkan hasil yang sedikit lebih baik daripada yang Anda posting.
sumber
Anda dapat mencoba melakukan deteksi tepi pada domain warna individual dan kemudian menggabungkannya, menggunakan metode pilihan Anda untuk deteksi tepi.
Dibandingkan dengan deteksi tepi langsung pada gambar berwarna, ini mungkin menghasilkan hasil yang lebih baik.
sumber
Makalah dari tautan rusak yang disediakan oleh isrish mungkin ditemukan Menggabungkan fitur gambar dan teks: pendekatan hibrid untuk pengenalan tulang belakang buku seluler , Proc. Konferensi internasional ACM ke-19 tentang Multimedia, 2011. Kita juga dapat melihat makalah lain dari David Chen et al. , misalnya Pelacakan Aset Berbiaya Rendah menggunakan Ponsel Kamera Lokasi-Sadar , Proc. SPIE 2010.
sumber