Baik OCR gratis dengan GUI untuk memperbaiki kesalahan? (untuk Windows)

9

Saya telah menggunakan SimpleOCR , yang memiliki GUI yang bagus untuk memperbaiki kesalahan. Sayangnya itu membuat banyak kesalahan! (dan menderita bug dan batasan lainnya)

Di sisi lain Tesseract lebih akurat tetapi tidak memiliki GUI sama sekali.

Pertanyaan saya adalah, apakah ada program OCR gratis untuk Windows yang memiliki GUI yang bagus dan tingkat kesalahan yang rendah? Saya ingin menyoroti kata-kata yang dicurigai (oleh ketidakpastian OCR, bukan hanya pemeriksaan ejaan) dan menunjukkan kata (bitmap) asli saat saya mengedit kata OCR seperti yang dilakukan SimpleOCR.

Open-source akan menjadi yang terbaik, diikuti oleh freeware, kemudian trial / demo / crippleware jauh di belakang.

Tangkapan layar SimpleOCR menunjukkan GUI untuk memperbaiki kesalahan

Hugh Allen
sumber
kemungkinan duplikat perangkat lunak OCR Gratis
Sathyajith Bhat
2
@Sathya: persyaratan spesifik saya membedakannya dari pertanyaan itu.
Hugh Allen
Tidak persis gratis, tetapi apakah Anda sudah melihat Microsoft Office? Itu datang dengan OCR. (Cari fitur "Microsoft Office Document Imaging" dalam pengaturan.)
Vivelin
@ Authoredrowner: Saya baru saja mencobanya. Akurasinya sebanding dengan Tesseract tetapi membutuhkan file TIFF dengan pengaturan DPI yang sesuai atau tidak berfungsi, dan tidak memiliki antarmuka untuk memperbaiki kesalahan OCR.
Hugh Allen
@Hugh Allen: Benarkah? Ini bekerja cukup baik ketika saya menemukan fungsi menu konteks di OneNote 2007. Dan saya menggunakan file gambar acak yang disalin dari sebuah situs web ...
Vivelin

Jawaban:

2

Sudahkah Anda mencoba gimagereader , front gui untuk Tesseract?

ukanth
sumber
Saya baru saja mencobanya (di bawah Windows) dan tidak berjalan untuk saya - proses keluar segera tanpa pesan kesalahan :( Pokoknya melihat screenshot itu tampaknya tidak benar-benar menyorot kata yang sedang Anda edit. Apakah Anda sudah mencoba itu?
Hugh Allen
2

OCRopus :

Perangkat lunak ini sebagian didasarkan pada Tesseract, mesin OCR open source terbaik yang tersedia untuk saat ini. Sementara proyek ini diharapkan akan dirilis pada akhir tahun depan dan akan digunakan untuk proyek pemindaian buku Google, tim memiliki beberapa aplikasi menarik dalam pikiran:

  • antarmuka layanan web
  • PDF, kamera, dan layar OCR
  • integrasi dengan alat pencarian desktop: Beagle, Spotlight, Google Desktop

OCRopus (tm) adalah analisis dokumen canggih dan sistem OCR, yang menampilkan analisis tata letak pluggable, pengenalan karakter pluggable, pemodelan bahasa alami statistik, dan kemampuan multi-bahasa.

Mesin OCRopus didasarkan pada dua proyek penelitian: pengenal tulisan tangan berkinerja tinggi yang dikembangkan pada pertengahan 90-an dan digunakan oleh biro Sensus AS, dan metode analisis tata letak kinerja tinggi yang baru.

OCRopus adalah pengembangan yang disponsori oleh Google dan pada awalnya ditujukan untuk throughput tinggi, upaya konversi dokumen volume tinggi. Kami berharap bahwa itu juga akan menjadi sistem OCR yang sangat baik untuk banyak aplikasi lainnya. teks alternatif Tautan:


GOCR

GOCR adalah program OCR (Pengenalan Karakter Optik), yang dikembangkan di bawah Lisensi Publik GNU. Ini mengkonversi gambar teks yang dipindai kembali ke file teks. Joerg Schulenburg memulai program, dan sekarang memimpin tim pengembang. GOCR dapat digunakan dengan ujung depan yang berbeda, yang membuatnya sangat mudah untuk port ke berbagai OS dan arsitektur. Itu dapat membuka berbagai format gambar, dan kualitasnya telah meningkat setiap hari. teks alternatif teks alternatif

Tautan:


Krazy_Kaos
sumber
Apakah salah satu dari mereka memiliki GUI yang layak untuk pergi bersama mereka?
Hugh Allen
1
Diedit menjawab pertanyaan Anda .... tetapi saya akan mengatakan: "Tidak, mereka tidak", tapi saya mendengar abiword mendukung OCRopus ( arstechnica.com/open-source/news/2007/08/… )
Krazy_Kaos
1
+1 untuk menambahkan tangkapan layar sebagai jawaban dan juga untuk meninjau ulang dua program yang ditawarkan ...
Kurt Pfeifle
0

Ada juga TOPOCR (alias SnapReader ), yang berisi Pemeriksa Ejaan pasca pemrosesan untuk 11 Bahasa:

SnapReader dapat digunakan untuk membuat catatan Anda sendiri yang dapat dicari dari hampir semua gambar dokumen. Atau Anda dapat menggunakannya sebagai alat pembuat dan membuat konten Anda sendiri yang dapat diedit menggunakan pemindai atau kamera Anda dan menyimpan hasilnya sebagai HTML atau PDF. SnapReader juga dapat mengubah teks menjadi audio berkualitas sangat tinggi menggunakan Audrey. Jadi Anda tidak hanya dapat menggunakan pemindai atau kamera untuk mengambil dokumen, kini Anda juga dapat menggunakan pemutar musik portabel atau ponsel cerdas untuk "membacanya".

gambar

harrymc
sumber