Dapatkah Acrobat 11 dibuat untuk melakukan OCR menggunakan beberapa inti CPU?

8

Pemrosesan OCR membutuhkan waktu. Menggunakan beberapa inti CPU akan mempercepat pemrosesan. Acrobat 10 bukan aplikasi multithreaded . Bagaimana dengan Acrobat 11? Apakah 11 secara default melakukan OCR menggunakan beberapa inti CPU (jika tersedia)? Jika tidak, apakah ada solusi, misalnya scripting, untuk membantu membuat Acrobat 11 melakukan OCR menggunakan beberapa core CPU? Baik melalui Acrobat yang dibangun dalam bahasa scripting atau menggunakan skrip eksternal yang meluncurkan dan mengarahkan beberapa instance single Acrobat untuk secara paralel dengan bagian-bagian dari pekerjaan pemrosesan.

Catatan: Pertanyaan ini tidak terlalu terlokalisasi (tidak terbatas pada momen tertentu dalam waktu) karena (1) Adobe tidak sering merilis versi Acrobat utama baru (Acrobat 10 dirilis dua tahun lalu) dan (2) Adobe Acrobat adalah sebuah aplikasi yang digunakan.

tarcman.
sumber

Jawaban:

6

Saya telah menginstal percobaan Acrobat 11 (XI) di VirtualBox. Acrobat 11 adalah utas tunggal.

Saya juga telah membuat skrip eksternal yang memulai beberapa instance Acrobat (satu per inti CPU), paralel memproses pekerjaan OCR dan menggabungkan hasilnya. Langkah penting adalah mengaktifkan kesalahan login di preferensi Acrobat, parsing semua .log dan proses ulang semua file kesalahan. Script (saat menggunakan 4 core) masih melakukan OCR lebih dari dua kali lebih cepat dari Acrobat 11 default.

tarcman.
sumber
4
Anda bisa memberikan sumbernya jika mau. Jika mereka berani menghapusnya, itu dapat dipulihkan dengan mudah.
Joey
Juga, jika Anda adalah orang yang sama yang memposting pertanyaan, pertimbangkan untuk menggabungkan kedua akun Anda yang tidak terdaftar saat ini dengan yang baru, yang terdaftar. Anda dapat mulai di sini , dan juga membaca ini untuk informasi lebih lanjut. Setelah itu, Anda dapat mengubah pertanyaan sesuai keinginan Anda.
Indrek
Saya tidak berusaha menghalangi apa pun. Karena Anda terus berganti nama pengguna, tampaknya pengeditan Anda dilakukan oleh pihak ketiga yang tampaknya tidak memahami pertanyaan awal. Juga, jika Anda ingin menjawab pertanyaan Anda sendiri, Anda harus menulis pertanyaan dan menjawab semuanya sekaligus.
Isaac Rabinovitch
Saya telah menggabungkan akun Anda (tidak terdaftar) untuk saat ini. Namun kami akan meminta Anda untuk tidak menggunakan alamat email sekali pakai, tetapi mendaftar di situs kami sehingga Anda dapat tetap masuk, mengomentari pertanyaan Anda, dan lain-lain. Juga, tidak ada yang akan dihapus, tidak ada yang perlu dikhawatirkan. Harap perhatikan bahwa pengeditan anonim selalu ditinjau lebih ketat.
slhck
1
@tarcman Apakah ada kemungkinan memposting skrip Anda? Saya yakin ada banyak orang yang tertarik menggunakannya
Jason
1

Multithreading perlu dibangun ke dalam suatu aplikasi. Pengembang harus menulis kode yang membuat utas dan yang memecah tugas menjadi subtugas yang dapat dialokasikan ke setiap utas. Jika pengembang Acrobat gagal melakukan ini untuk kode pengenalan OCR mereka, tidak ada cara bagi pengguna untuk membuat logika tambahan yang diperlukan.

Isaac Rabinovitch
sumber
2
Jika itu dapat diterapkan ke rentang halaman Anda mungkin dapat mencoba untuk membagi pekerjaan menjadi beberapa proses, masing-masing OCR hanya beberapa halaman dan kemudian menggabungkan hasilnya kembali bersama.
Joey
0

Untuk menggunakan semua core untuk OCR Anda mungkin ingin melihat PDF-Exchange Editor. Mesin OCR tampaknya menggunakan semua core pada sistem saya. Setelah Anda mencapai tingkat kinerja ini, masuk akal untuk menggunakan SSD.

Harus ada tweak windows yang akan menyebabkannya mendedikasikan lebih banyak waktu CPU untuk aplikasi berulir tunggal yang tidak terikat I / O. Di sistem saya Acrobat tidak diperlambat oleh kinerja disk tetapi waktu CPU paling banyak saya membangun indeks adalah sekitar 30%.

Mari kita hadapi itu, Acrobat adalah aplikasi yang banyak digunakan tetapi ditulis dengan buruk. Acrobat Pro memiliki beberapa fitur yang masih belum Anda dapatkan di tempat lain (belum).

Len
sumber