Saya ingin memindai sejumlah besar kertas yang saya miliki tergeletak di sekitar, dengan kerumitan sesedikit mungkin. Saya ingin mengonversinya menjadi gambar menggunakan Simple Scan, lalu mengonversinya menjadi teks menggunakan OCR. Apakah ada aplikasi OCR yang bagus dengan GUI yang akan memberi saya hasil yang baik dengan menekan tombol?
78
Jawaban:
GOCR dari adalah program OCR (Pengenalan Karakter Optik). Mengkonversi gambar teks yang dipindai kembali ke file teks.
CLARA adalah pilihan grafis lain yang bagus.
OCRAD dari adalah OCR dapat digunakan sebagai aplikasi konsol yang berdiri sendiri, atau sebagai backend ke program lain.
KOOKA dari adalah aplikasi KDE tetapi berfungsi dengan baik, selain itu Anda harus menginstal program OCR aktual seperti GOCR dan OCRAD. Setelah menginstal Kooka dan program OCR, Anda harus mengarahkan Kooka ke lokasi pemasangan OCR agar dapat menginstal ubah JPEG menjadi teks.
OCRFeeder dari adalah analisis tata letak dokumen dan sistem pengenalan karakter optik.
Tesseract dari adalah utilitas baris perintah dan sangat mudah digunakan. Anda dapat menginstal paket bahasa tesseract-ocr-eng dari sini .
Lihat halaman ini .
Catatan:
Untuk menjalankan terminal goto tesseract dan ketik yang berikut ini
Tesseract hanya dapat membaca file TIFF - jika Anda punya JPEG atau PDF atau apa pun, Anda harus mengonversinya. Selain itu, ekstensi nama file harus .tif, bukan .tiff, jika tidak, kesalahan tesseract out.
sumber
tesseract
(3.04.00 pada Ubuntu 15.10) tidak memiliki masalah denganPNG
file input. ia menerimaJPG
file, tetapi memberikan hasil yang lebih buruk bagi mereka, seperti yang diharapkan dari artefak kompresi tambahan.Ada beberapa alat baris perintah OCR yang populer yang dapat Anda gunakan (Saya tidak yakin apakah mereka memiliki GUI):
Tesseract ( ReadMe , FAQ ) (Python)
Juga tersedia untuk: Tesseract .NET , Tesseract iOS
Pemakaian:
GOCR
OCRopus ™ ( FAQ ) (ditulis dengan Python, NumPy, dan SciPy)
Tessnet2 (Sumber terbuka, OCR, Tesseract, .NET, DOTNET, C #, VB.NET, C ++ / CLI)
Beberapa lainnya: ABBYY CLI OCR untuk Linux , Asprise OCR
Untuk daftar yang lebih lengkap, periksa: Daftar perangkat lunak pengenalan karakter optik di Wikipedia
Lihat juga:
wanghaisheng/awesome-ocr
- Daftar sumber daya OCR yang menjanjikan di GitHub.sumber
linux-intelligent-ocr-solution
disclaimer - Saya terhubung erat dengan pengembangan solusi opensource ini
Lios dapat mengonversi cetak menjadi teks menggunakan pemindai atau kamera.
Itu juga dapat menghasilkan teks dari gambar yang dipindai dari sumber lain seperti Pdf, Gambar atau Folder yang berisi Gambar.
Program diberikan aksesibilitas total untuk tunanetra.
Karena saya terhubung erat - saya akan sangat menyukai umpan balik.
sumber
Gscan2PDF
OCR pada halaman multi PDF atau dokumen yang dipindai
Ini mungkin cara termudah. Gscan2pdf adalah alat grafis yang memungkinkan Anda tidak hanya memindai file, tetapi juga mengimpor file dan melakukan OCR pada mereka. Instal gscan2pdf dari sini , dari Ubuntu Software Center atau jalankan perintah ini di terminal:
Gscan2PDF dapat menggunakan mesin OCR yang dapat disesuaikan, standarnya adalah
tesseract-ocr
Anda mungkin mempertimbangkan untuk memilih bahasa yang sesuai. Dalam hal ini Anda perlu menginstal
tesseract-ocr-LANG
paket, di manaLANG
kode huruf ISO 639-2 tiga huruf. Saat ini Anda memiliki 108 bahasa pada 16,04 repo.sumber
Saya baru saja sukses (di bawah 16,04) dengan pdfocr.rb . Ini terdaftar di wiki Ubuntu
Berikut ini adalah ppa tetapi repositori untuk 16.04 tidak diperbarui. Skrip ruby di atas dari github meskipun masih berfungsi dengan 16.04.
Anda dapat mengunduhnya dari Github. Anda perlu menginstal paket-paket berikut:
kemudian membuat pdfocr.rb dieksekusi dan dijalankan:
Secara opsional, Anda dapat menggunakan
-l LANG
parameter. Dalam hal ini Anda harus menginstaltesseract-ocr-LANG
paket, di manaLANG
kode huruf ISO 639-2 tiga huruf. Saat ini Anda memiliki 108 bahasa pada 16,04 repo.sumber
Cara terbaik dan termudah di luar sana adalah menggunakannya
pypdfocr
tidak mengubah pdf. pypdfocr adalah tautan modul python di sini.Pada akhirnya Anda akan memiliki
your_document_ocr.pdf
cara lain yang Anda inginkan dengan teks yang dapat dicari. Aplikasi tidak mengubah kualitas gambar. Menambah ukuran file sedikit dengan menambahkan teks overlay.Saya pikir perintahnya cukup mudah sehingga tidak memerlukan GUI. Mungkin menginstal pypdfocr sedikit lebih verbose:
Pembaruan 3 November 2018:
pypdfocr
tidak lagi didukung sejak 2016 dan saya melihat beberapa masalah karena tidak dibimbing.ocrmypdf
( modul melakukan pekerjaan similiar dan dapat digunakan seperti ini:Untuk memasang:
atau
sumber
Hanya karena ini bekerja dengan sangat baik dan tentunya harus ada dalam daftar:
Contoh gimageReader dari tangkapan layar:
Itu ada di dalam repo (dijawab pada 18.10, tetapi sudah menggunakannya sejak lama)
sumber
eng
sebagai pilihan ... tapi saya berhasil! :) Berjalansudo apt install tesseract-ocr-eng
di terminal melakukan trik. Akan lebih baik jika ini didokumentasikan dalam file bantuan gimageReader atau "README" di github ... atau di suatu tempat. Seperti di sini, mungkin.gscan2pdf mencakup 3 mesin ocr yang berbeda. Anda dapat memindai langsung ke program atau mengimpor pdf Anda ke dalam program. Saya menemukan mesin Tesseract bekerja sangat baik, dan sangat mudah digunakan
sumber