memindai dokumen A4> pdf> ocr> menerjemahkan ke bahasa Inggris?

2

Saya sudah mencoba menggunakan kombinasi

  • pemindai rumah saya untuk membuat '300 dpi', 'dokumen', 'pdf' (opsi pada Canon all-in-one)
  • ZoHoViewer untuk membuat file RTF atau TXT
  • google docs untuk menerjemahkan

Saya tidak yakin seberapa baik atau buruk suatu produk ZoHoViewer, tetapi berikut ini:

Als Arbeitsmarkbehörde haben wir den gesetzlichen Auftrag, die Vermittelbarkeit von

berubah menjadi:

AlsArbeitsmarktbeh6rde habenwirdengesetzlichenAuftrag, dieVermittelbarkeit vonSt ...

akibatnya, dokumen goog membuat sarapan babi mencoba menerjemahkannya.

Adakah yang punya saran yang lebih baik (lebih disukai layanan online gratis)

Adolf bawang putih
sumber
Karena tidak ada duplikat "tepat", saya membiarkan yang ini terbuka. Namun Anda harus membaca pertanyaan yang saya tautkan, karena mereka mungkin akan menawarkan solusi yang memungkinkan
Ivo Flipse
Jika ada orang yang tertarik terjemahannya haruslah "Ketika otoritas pasar tenaga kerja, kita memiliki mandat hukum, kemampuan kerja" - atau sesuatu seperti itu
ChrisF
koreksi: "Sebagai otoritas pasar kerja" ... terdengar lebih baik :)
@Molly - Itu hanya copy 'n' paste ke Google Translate!
ChrisF

Jawaban:

5

Ada beberapa pertanyaan lain tentang SuperUser di OCR, yang mungkin layak untuk dicoba solusinya.

Terutama , jawaban Molly ini tampak menjanjikan:

Saya sangat suka TopOCR , tentu tambahan yang bagus untuk alat pindai Anda:

  • Akurasi OCR yang luar biasa, hingga 99,8% dengan kamera 3 MP
  • Tidak ada batasan halaman, dan tidak diperlukan pengunduhan atau komponen tambahan
  • Menangani gambar dengan teks dan gambar campuran (Manual atau Zonasi Otomatis)
  • Menoleransi pencahayaan yang miring dan tidak rata
  • Berbagai format output teks, termasuk PDF dan HTML yang dapat dicari
  • Dapat membaca 11 bahasa berbeda
  • Powerfull, mudah digunakan Pemrosesan Gambar dengan Image Dewarping
  • Mendukung Smartphone: Lihat beberapa sampel Smartphone
  • Termasuk Editor Teks dan Gambar WYSIWYG berfitur lengkap dan terintegrasi
  • Pemeriksa ejaan pasca pemrosesan untuk semua 11 bahasa
  • Perangkat lunak Text-To-Speech bawaan. Bagaimana dengan OCR ke MP3?
  • Termasuk penerjemah teks multi-bahasa built-in
  • Mendukung Antarmuka Baris Perintah dan GUI
  • Membuat sistem pencarian dan pengindeksan dokumen berkinerja tinggi
  • Mode Pembantu Peramban mendukung pembuatan eBook audio gratis
  • Dengan Mesin Web TopOCR, mudah untuk menambahkan fitur-fitur baru

teks alternatif

ini sangat akurat dan berfungsi sangat baik dengan gambar berkualitas rendah seperti foto halaman / dokumen

TopOCR adalah freeware (dapat dibuat portabel dengan Universal Extractor )

Bacaan lebih lanjut:

Perangkat lunak OCR mana yang memiliki opsi terbanyak?

Solusi OCR praktis untuk mengonversi buku besar ke format digital?

Bagaimana cara mengekstrak teks dengan OCR dari PDF di Linux?

Ivo Flipse
sumber
"downvoting business" ini di sini semakin menggelikan, bahkan TopOCR ideal untuk pekerjaan ini karena ia 'mengerti' bahasa Jerman (dan banyak bahasa lain) dan termasuk seorang penerjemah. +1 dan ditandai untuk perhatian moderator.
2 Atas, 2 bawah: /
Sathyajith Bhat
Terlihat bagus, tetapi saya tidak benar-benar ingin harus mengeluarkan kamera ketika saya ingin memindai dokumen. Saya dapat melihat bagaimana hal itu mungkin baik jika Anda tidak memiliki pemindai atau sedang bepergian dengan ponsel Anda.
Adolf bawang putih
Ini berarti Anda juga dapat melakukannya pada dokumen yang dipindai ;-)
Ivo Flipse
Ok, saya akan mencobanya.
Adolf bawang putih
4

Mengingat bahwa OCR telah dikonversi:

Als Arbeitsmarkbehörde ...

untuk:

AlsArbeitsmarktbeh6rde ...

Beberapa hal muncul dalam pikiran.

  1. Coba pindai pada dpi yang lebih tinggi. Sepertinya tidak bisa mengenali ruang di antara kata-kata, dpi yang lebih tinggi dapat meningkatkan itu.

  2. Bisakah Anda mengatur bahasa program OCR Anda? Saya melihat bahwa itu mengubah "ö" menjadi "6". Walaupun ini mungkin merupakan masalah yang disebabkan oleh resolusi, tetapi mungkin juga karena "ö" bukan bagian sehari-hari dari bahasa Inggris, program ini memilih kecocokan "terbaik berikutnya" - dalam hal ini "6".

ChrisF
sumber
Poin bagus, Chris!
Ivo Flipse
Telah dipindai ulang pada 600dpi, saya hanya menunggu (selamanya) untuk zamzar mengirimi saya dokumen yang dikonversi .... Saya kira ketika itu gratis, Anda tidak dapat berharap terlalu banyak, tetapi hampir sehari !? Terlalu lama
adolf bawang putih
Sekarang saya baru memeriksa dan konversinya sudah kadaluwarsa. Memulai lagi. Harumph.
Adolf bawang putih
Naah. zamzar tidak berguna untuk mengenali spasi bahkan pada 600 dpi, akan mencoba alat lain untuk konversi.
Adolf bawang putih
0

Tidak 100% sempurna tetapi yang terbaik dari semua hal yang saya coba:

http://www.paperfile.net/ dikombinasikan dengan paket bahasa (gratis untuk mengunduh petunjuk dalam aplikasi) salin dan rekatkan seluruh teks ke google doc, lalu gunakan alat> terjemahkan dalam google docs

Adolf bawang putih
sumber