Saya memiliki file PDF yang merupakan pemindaian formulir yang berisi gambar, tabel, dan teks.
Saya ingin menjalankan program (bukan alat online) pada file dan membuatnya menghasilkan file txt yang mengandung kata-kata. Tidak terlalu sibuk tentang pemformatan.
Perhatikan bahwa ini bukan pengulangan 'Konversi pdf ke teks mengabaikan struktur' karena ini mengacu pada teks dalam dokumen PDF lurus, bukan gambar yang dipindai yang disimpan sebagai PDF.
1
Hai, saya menggunakan acrobat 9 pro. Di bawah menu Documents-> OCR text recognition. Apakah opsi ini membantu Anda? Karena begitu Anda menjalankan OCR - Adobe akan memungkinkan Anda untuk memilih teks - salin dan tempel ke notepad (atau kata). Atau ada alat untuk mengonversi PDF Anda ke kata (post OCR run) ... Apakah ini mengotomatiskan kebutuhan Anda?
Prasanna
@ Prasanna, saya perlu menjalankan program untuk melakukannya, dapatkah Acrobat 9 dijalankan secara non-interaktif?
FrinkTheBrave
Saya belum pernah menggunakan Acrobat 9 secara non-interaktif, mungkin ada orang dari dunia Adobe yang bisa membantu? Sebaliknya, dapat file batch membuka program dan menavigasi melalui menu seperti yang dilakukan orang - seperti makro tingkat windows .. Maaf saya mengajukan lebih banyak pertanyaan daripada menyelesaikan masalah Anda ...
Prasanna
Anda pada dasarnya membutuhkan OCR. Jika Anda memiliki pemindai, beberapa perangkat lunak OCR (primitif) mungkin disertakan bersama itu.
Daniel R Hicks