Apakah ada alat yang lebih kuat daripada Automator untuk mengekstraksi teks dari banyak PDF?

3

Ada tindakan di Automator yang memungkinkan Anda secara terprogram " Ekstrak Teks PDF ", tetapi gagal ketika diumpankan sejumlah file moderat (25 hingga 100). Lebih buruk lagi, gagal tanpa mencatat apa pun yang membantu kecuali untuk pesan yang" Automator Berhenti Tanpa Terduga ".

Adakah yang tahu tentang perintah yang setara untuk melakukan ini di Applescript? Saya mencari alat di mana saya memiliki lebih banyak kontrol atas hal-hal seperti logging dan penanganan kesalahan sehingga saya bisa lebih efisien dalam memproses file PDF ke dalam format teks.

user141146
sumber
Untuk menghindari jawaban sepele seperti "ya" dan "tidak" dan mungkin, gunakan Applescript untuk memanggil aplikasi Automator untuk melakukan ekstraksi, harap jelaskan mengapa Automator bukan alat untuk Anda. Semakin banyak "mengapa" Anda dapat menambahkan, semakin mudah bagi seseorang untuk menjawab. Namun, Anda tidak perlu melakukan apa pun - seseorang mungkin hanya memiliki jawaban yang Anda cari dengan perincian yang diberikan.
bmike
@bmike bagian dari masalah ini adalah bahwa automator terus mogok ketika saya mencoba menerapkan alur kerja ekstraksi teks ... dan crash sepertinya "acak". yaitu, alur kerja akan beralih melalui # berbeda file PDF, mengekstraksi teks dengan baik dan kemudian Automator akan mati dengan "Automator Berhenti Tanpa Terduga" ... Jadi ... Automator tidak melakukan trik ... Saya mungkin dapat menambahkan penanganan kesalahan jika file PDF spesifik menyebabkan crash (yang sepertinya tidak mungkin), tetapi pada akhirnya Applescript memberi saya kontrol lebih baik atas apa yang saya lakukan.
user141146
@ user141146 Anda bisa mencoba sejda.com
Simon

Jawaban:

2

Saya tidak tahu bagaimana membandingkannya dengan opsi lain, tetapi Anda bisa menggunakan pdfotext. Dapat diinstal dengan brew install xpdf.

do shell script "/usr/local/bin/pdftotext /usr/share/doc/bash/bash.pdf -" without altering line endings

Calibre juga dilengkapi dengan beberapa utilitas baris perintah:

/Applications/calibre.app/Contents/MacOS/ebook-convert /usr/share/doc/bash/bash.pdf /tmp/output.txt

Pertanyaan-pertanyaan Terkait:

Lri
sumber