Implementasi Java OCR [ditutup]

160

Ini terutama hanya rasa ingin tahu, tetapi apakah ada implementasi OCR di Jawa murni? Saya ingin tahu bagaimana ini akan tampil murni di Jawa, dan OCR pada umumnya menarik minat saya, jadi saya ingin melihat bagaimana ini diterapkan dalam bahasa yang saya pahami sepenuhnya. Tentu saja, ini membutuhkan implementasi open source, tetapi saya masih tertarik pada solusi yang dipatenkan, karena saya setidaknya bisa melihat kinerja dalam hal itu.

Saya telah melihat pasangan yang dapat digunakan di Jawa (seperti Asprise ) tetapi tampaknya ini bukan implementasi Java murni ... apakah ada?

tikus
sumber
@Robik Pertama-tama, saat Anda melakukannya, Anda juga harus menghapus terima kasih yang tidak perlu dll. Dan kedua, Anda tidak boleh mengedit dengan asumsi seperti itu, terutama jika OP masih aktif dan Anda hanya dapat berkomentar - meskipun kemungkinan akan benar dalam kasus ini ... @ rat Hanya untuk memperjelas, maksud Anda asprise?
Tobias Kienzler
Jika Anda tidak mencari pendekatan Java murni, maka mungkin membangun jembatan JNI (seperti Tess4J ) masuk akal. Perasaan saya adalah bahwa pustaka OCR lebih baik diwakili di dunia C ++ (OCRAD, GOCR, Cuneiform - lihat semuanya di sini ).
dma_k
@rat - Anda benar - Asprise OCR SDK untuk Java tidak murni berbasis Java. Bahkan, di belakang layar, kode asli digunakan karena OCR adalah proses yang sangat mahal secara komputasi.
Dukungan Kejutan

Jawaban:

81

Saya sarankan mencoba proyek Java OCR di sourceforge.net. Saya awalnya mengembangkannya, dan saya punya posting blog di atasnya .

Sejak saya memasangnya di sourceforge, fungsinya telah diperluas dan ditingkatkan sedikit melalui karya hebat dari sukarelawan peneliti / pengembang.

Cobalah, dan jika Anda tidak menyukainya, Anda selalu dapat meningkatkannya!

Ron
sumber
18
@ Ron, saya sudah melihat proyek juga. Saya tidak menemukan demo dan GUI melakukan berbagai operasi grafis tetapi tidak ada instruksi tentang cara mendapatkan pengenalan karakter yang sebenarnya.
James P.
1
@Ron ketika saya mengikuti tautan ke blog Anda maka saya melihat halaman kosong.
neoneye
3
@Ron di mana saya bisa mendapatkan dokumentasi atau blog atau tutorial tambahan.
altsyset
1
bagaimana cara mengimpor java ocr di eclipse?
Faisal Ashraf
2
Hai, apakah ada tutorial untuk ini?
Sumur
10

Kami telah menguji beberapa mesin OCR dengan Java seperti Tesseract, Asprise, Abbyy dll. Dalam analisis kami, Abbyy memberikan hasil terbaik.

Langit biru
sumber
1
API Java atau implementasi Java ..?
Ewoks
Tidak ada tetapi ada versi baris perintah yang dapat Anda gunakan untuk berbicara ProcessBuilder.
Aaron Digulla
1
Baik Tesseract maupun Abbyy tidak berbasis Java. Mereka hanya memiliki API untuk Java.
krispy
10

Jika Anda mencari opsi yang sangat dapat diperluas atau memiliki domain masalah khusus, Anda dapat mempertimbangkan untuk menggulirnya sendiri menggunakan Java Neural Engine Berorientasi Objek . JOONE yang lainReferensi .

Saya menggunakannya dengan sukses dalam proyek pribadi untuk mengidentifikasi surat dari gambar seperti ini , Anda dapat menemukan semua sumber untuk komponen OCR dari aplikasi saya di github, di sini .

davetapley
sumber
1
Ooh, terima kasih untuk contohnya. Saya mengunduhnya dan berencana untuk menyesuaikannya untuk kebutuhan saya sendiri!
Amanda S
Bisakah Anda menunjukkan kepada saya cara mengkompilasi?
RadijatoR
Saya khawatir proyek ini tidak lagi dikelola @RadijatoR, jadi saya tidak bisa memberikan saran.
davetapley
4
Sebagian besar tautan mati.
Erik
5

Ada berbagai perpustakaan OCR di luar sana. Namun, pengalaman saya adalah bahwa implementasi komersial utama, ABBYY, Omnipage, dan ReadIris, jauh melebihi open-source atau implementasi kecil lainnya. Perpustakaan komersial ini pada dasarnya tidak dirancang untuk bekerja dengan Java, meskipun tentu saja itu mungkin.

Tentu saja, jika minat Anda adalah mempelajari kode, implementasi open-source akan melakukan trik.

Joshua Fox
sumber
3

Baru saja menemukan yang ini (tidak tahu, tidak diuji, periksa sendiri)

Ron Cemer Java OCR


Karena Anda hanya memerlukan ini untuk rasa ingin tahu, Anda dapat melihat ke sumber applet ini.

Itu OCR karakter tulisan tangan dengan jaringan saraf

Java OCR: Pengakuan Tulisan Tangan

naik opelet
sumber