Bagaimana cara mengekstrak teks dari PDF yang tidak dibuat dengan indeks? Ini semua teks, tetapi saya tidak dapat mencari atau memilih apa pun. Saya menjalankan Kubuntu, dan Okular tidak memiliki fitur
Optical character recognition (OCR) adalah proses mengubah gambar teks ke teks yang dapat dimanipulasi oleh pengolah kata, dll.
Hari ini saya menerima PDF dari pemasok kami dan berisi beberapa halaman yang dicetak dan dipindai dengan tanda tangan dll. Saya membukanya di Acrobat Reader DC. Tapi yang mengejutkan saya, teks dari gambar yang dipindai jelas dapat dipilih dan disalin sebagai teks. Lihat tangkapan layar: Jelas...
Ini telah dibahas setahun yang lalu di sini: Batch OCR untuk banyak file PDF (belum OCR) Apakah ada cara untuk batch OCR PDF yang belum OCRed? Ini, saya pikir, keadaan saat ini berurusan dengan dua masalah: Batch OCR PDF Windows Acrobat - Ini adalah mesin OCR paling lurus yang akan batch OCR....
Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Pengguna Super. Ditutup 4 tahun yang lalu . Saya memiliki PDF dari buku yang dipindai. Saya mencari...
Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Pengguna Super. Ditutup 4 tahun yang lalu . Banyak kali saya menemukan bitmap dengan apa-apa selain...
Evernote melakukan OCR pada gambar yang Anda simpan. Apakah ada cara untuk mendapatkan teks lengkap yang setara dengan gambar di Evernote, atau apakah OCR hanya untuk
Saya telah mencari Google untuk beberapa waktu tetapi tidak dapat menemukan jawaban untuk pertanyaan saya. Saya memiliki lapisan OCR yang tidak diinginkan dalam dokumen yang baru-baru ini saya pindai dengan Adobe Acrobat. Itu belum di-OCR dengan benar, dan saya ingin mengurangi beberapa informasi,...
Saya berakhir di tempat kakek saya akhir pekan lalu. Nenek saya mengeluarkan buku sejarah keluarganya yang besar (~ 1400 halaman) ini sekitar tahun 1630. Kutu buku raksasa seperti saya, saya pikir akan licin untuk memiliki semua informasi yang disimpan dalam database dan tersedia dari web. Saya...
PDF ini diproduksi oleh Abbyy Finereader 10: http://ebooks.zeitr.org/from_abbyy.pdf Anda dapat menyalin & menempelkan kalimat pertama dan mendapatkan hasil teks ini (sangat bagus): Der »Bund Deutscher Gymnastik-Schulleiter« «pada 20 November 1955 anläßlich einer Zusammenkunft der...
Saya telah menggunakan SimpleOCR , yang memiliki GUI yang bagus untuk memperbaiki kesalahan. Sayangnya itu membuat banyak kesalahan! (dan menderita bug dan batasan lainnya) Di sisi lain Tesseract lebih akurat tetapi tidak memiliki GUI sama sekali. Pertanyaan saya adalah, apakah ada program OCR...
Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Pengguna Super. Ditutup 5 tahun yang lalu . Saya menggunakan Pencarian Desktop Google (saya di...
Pemrosesan OCR membutuhkan waktu. Menggunakan beberapa inti CPU akan mempercepat pemrosesan. Acrobat 10 bukan aplikasi multithreaded . Bagaimana dengan Acrobat 11? Apakah 11 secara default melakukan OCR menggunakan beberapa inti CPU (jika tersedia)? Jika tidak, apakah ada solusi, misalnya...
Bagaimana Anda memulai pemindaian dan pengenalan karakter menggunakan Microsoft Office Word 2010 (Beta)? Saya tidak bisa menemukan opsi untuk memindai dokumen di pemindai saya langsung ke dokumen Word 2010. Saya telah memeriksa pengaturan instalasi untuk Office 2010 (Beta) dan elemen OCR...
Saya menjalankan Windows 10dengan Microsoft Office professional Plus 2016di komputer saya. Sepertinya fungsionalitas MS OCR diaktifkan di sistem saya karena OneNotedapat menyalin teks dari gambar. Tetapi bagaimana cara mengaktifkan fungsi ini Greenshot? Saat ini saya memiliki menu berikut setelah...
Saya mengkompilasinya dari sumber dengan leptonica. Ini adalah gambar png dengan latar belakang transparan, yang saya edit menambahkan warna biru dan masih ada kesalahan ini: Tesseract Open Source OCR Engine v3.02.02 with Leptonica Empty page!! Empty page!! Inilah input gambar:...
Saya baru mengenal gscan2pdf 0.9.31, dan hanya menggunakannya untuk OCR pdf yang dipindai. Setelah menyimpan pdf, teks OCR disimpan di sudut kiri atas. Namun saya ingin setiap karakter OCR ditambahkan ke tempat asal OCR, untuk membuat file pdf dapat dipilih teks. Bisakah saya melakukan...
Apakah ada cara untuk mengkonversi subtitle dvdsub (berbasis gambar) menjadi srt? misalnya dengan mencoder atau ffmpeg yang dikombinasikan dengan tesseract? Saya mencari sesuatu yang berbasis command-line, dan saya baik-baik saja dengan harus melewati beberapa pass. Saya kurang tertarik pada alat...
Saya sudah mencoba menggunakan kombinasi pemindai rumah saya untuk membuat '300 dpi', 'dokumen', 'pdf' (opsi pada Canon all-in-one) ZoHoViewer untuk membuat file RTF atau TXT google docs untuk menerjemahkan Saya tidak yakin seberapa baik atau buruk suatu produk ZoHoViewer, tetapi berikut...
Bagaimana saya bisa mengimpor tabel dari file gambar yang dipindai (jpg / pdf) ke spreadsheet? Contoh pemindaian ada di
Apakah Anda tahu perangkat lunak pendeteksi teks, dari gambar atau video, tersedia sebagai demo atau demo video? Tolong beri saya beberapa tautan. Sunting: lebih baik dengan beberapa kertas dan realisasinya. Sunting2: Saya ingin menerapkan algoritma pendeteksian teks dari video atau gambar....