Saya ingin mengotomatiskan proses menemukan dan mengganti hrefs (bukan anchor text) dalam 100-an file PDF dalam OS Windows 8.1.
Saya senang mengonversi format file selama mereka dapat dikompilasi ulang sebagai PDF yang berfungsi.
UPDATE: Saya telah dapat menemukan dan mengganti hanya href menggunakan PDFTK ..
- pdftk foo.pdf output foo.tmp tidak terkompresi
- temukan dan edit tautan menggunakan editor teks
- pdftk foo.tmp output kompas foo-updated.pdf
Sekarang saya memerlukan alat cmdline yang dapat mengotomatisasi langkah 2 dengan mengganti nilai foo.tmp dari daftar temukan dan ganti.
pdf
batch
script
find-and-replace
darmi
sumber
sumber
Jawaban:
Saya akan berasumsi kita berbicara tentang OS Windows dan dengan tag Batch Anda akan merujuk ke pemrosesan batch, bukan Batch lang, lagipula saya akan menyarankan bahwa Batch adalah bahasa terbatas yang hanya mencakup tugas-tugas dasar sistem yang umum, itu tidak dimaksudkan untuk membaca file teks tidak biasa seperti PDF, itu tidak bisa.
Untuk membaca format tertentu seperti PDF diperlukan parser / juru bahasa eksternal.
Ada solusi berbasis C # yang bagus yang menunjukkan cara membaca data yang terkandung dalam PDF dengan cara yang dapat dibaca manusia:
https://stackoverflow.com/questions/2550796/reading-pdf-content-with-itextsharp-dll-in-vb-net-or-c-sharp
Ini menggunakan pustaka iTextSharp , yang merupakan open-source:
http://sourceforge.net/projects/itextsharp/
Atau, berikut adalah solusi berbasis VBS dari panduan pengguna Adobe, diperlukan objek COM yang diinstal dari aplikasi Adobe.
http://wwwimages.adobe.com/content/dam/Adobe/en/devnet/indesign/sdk/cs6/scripting/InDesign_ScriptingGuide_VB.pdf
Perhatikan bab-bab di mana Anda tertarik untuk tugas ini:
Untuk sedikit membantu Anda dalam VBS, berikut adalah pertanyaan skrip VBS yang dapat membantu Anda:
Tapi saya akan menyarankan tampaknya itu tidak berfungsi seperti yang diharapkan, saya mengambilnya dari situs ini:
http://www.experts-exchange.com/Programming/Languages/Visual_Basic/VB_Script/Q_26834618.html
sumber