Anda bisa menggunakannya pdftk
untuk ini. Info lebih lanjut: Cara Mengekspor dan Mengimpor Bookmark PDF .
Ekspor bookmark PDF pada baris perintah seperti ini:
pdftk C:\Users\Sid\Desktop\doc.pdf dump_data output C:\Users\Sid\Desktop\doc_data.txt
Impor bookmark PDF dari file data seperti ini:
pdftk C:\Users\Sid\Desktop\doc.pdf update_info C:\Users\Sid\Desktop\doc_data.txt output C:\Users\Sid\Desktop\updated.pdf
pdftk
Format bookmark agak membosankan untuk ditulis. Sebaliknya saya membuat naskah saya sendiri menggunakan bash
, sed
, pdftk
dan python3
. Lihat di repo ini: https://github.com/SiddharthPant/booky
Jadi sekarang saya dapat membuat file teks ( bkmrks.txt
) seperti ini yang hanya membutuhkan 5 menit untuk menulis bahkan untuk pdf 1000 halaman.
{
Title1, 1
Title2, 2
{
Subtitle1, 3
Subtitle2, 4
{
SubSubtitle1, 5
...
}
}
}
dan kemudian gunakan skrip saya
./booky.sh pdf_file.pdf bkmrks.txt
ini secara otomatis membuat pdf ( pdf_file_new.pdf
) yang memiliki bookmark saya di dalamnya.
Ini akan bekerja di sistem * nix jika Anda menggunakan mesin Windows. Kemudian instal terlebih dahulu python3
dan pdftk
cukup gunakan booky.py
file dalam repo untuk mengkonversi bkmrks.txt
ke pdftk
format yang kompatibel
python3 booky.py < bkmrks.txt > output.txt
dan kemudian menggunakan perintah ekspor untuk menghasilkan file data yang dibuang. Hapus bookmark sebelumnya dari file itu dan masukkan konten output.txt
alih - alih menggunakan tempel salinan sederhana. Dan kemudian impor data itu kembali.
Spesifikasi untuk file PDF tersedia sebagai PDF yang dapat diunduh secara bebas dari Adobe - atau setidaknya itu yang terakhir kali saya periksa. Namun, sebagian besar file PDF memiliki data terkompresi yang paling banyak. Mungkin ada versi PDF pada dasarnya plaintext sekali waktu, dan jika demikian itu masih akan valid sekarang, tetapi sebenarnya mendapatkan file dalam bentuk itu mungkin menjadi masalah.
Meskipun saya belum melakukannya, satu kemungkinan yang sangat mungkin (jika Anda bersedia membayar) adalah membeli Acrobat Pro, dan menggunakan kemampuan scripting Javascript yang dibangun ke dalam aplikasi itu. Untuk memulainya ...
http://acrobatusers.com/tutorials/2008/10/auto_bookmark_creation
Tutorial ini menunjukkan cara membuat bookmark secara otomatis menggunakan Javascript di Acrobat 7.0 Pro (versi yang termasuk dalam Creative Suite CS2). Meskipun sudah agak tua, teknik yang sama harus bekerja dengan baik untuk versi yang lebih baru.
Aplikasi Adobe memang menyertakan pustaka untuk membaca / menulis file teks menggunakan Javascript (sesuatu yang Javascript tidak miliki sebagai standar), sehingga dimungkinkan untuk menulis skrip impor / ekspor Anda sendiri, meskipun tidak sepele untuk membuat skrip tersebut kuat.
sumber
Untuk mengekspor bookmark, saya mengikuti pendekatan berbeda yang membutuhkan penggunaan Microsoft OneNote:
Saya membuka pembaca PDF (saya menggunakan versi gratis Foxit) dengan struktur bookmark terlihat dan kemudian, di OneNote, saya meminta untuk mengambil snapshot, dan pilih struktur bookmark Foxit.
Kembali ke OneNote, saya memilih opsi "Salin teks dari gambar" (dalam menu yang muncul setelah mengklik kanan gambar foto), dan saya menempelkannya di samping, untuk memperbaiki lekukan (biasanya dengan peluru).
sumber
HandyOutline. 1 seret, 1 klik, selesai. https://sourceforge.net/projects/handyoutlinerfo/ . Bebas. Indentasi sub-penanda. Tidak memerlukan pembaca / editor PDF. Juga edit, ekspor semua detail ke teks (salin ke kata tulis makro untuk merapikannya ke dokumen kata yang berfungsi penuh) atau XML, repaginate, impor ke PDF. Dev layak mendapat donasi.
PDF-Xchange Editor (menggantikan PDFViewer) bookmark yang digandakan / tidak terjawab yang diekspor ke teks
JPDF membutuhkan Java, mengekspor format sampah, tidak bisa membersihkannya untuk mendapatkan nama saja
PDFtk memberi saya sakit kepala hanya dengan melihat petunjuknya
:-)
sumber
Saya menemukan solusi lain yang agak "bodoh" untuk menyalin semua bookmark dalam PDF sebagai teks untuk digunakan di tempat lain. Di Acrobat Pro (untuk Mac OS) tidak ada cara untuk memilih semua bookmark dan menyalin / menempelnya di Wordprocessor. Namun Anda dapat mengekspor seluruh PDF sebagai file HTML dengan opsi "satu halaman HTML tunggal + tambahkan bingkai navigasi berdasarkan bookmark". Kemudian buka HTML di browser, pilih semua teks dalam bingkai navigasi dan salin / tempel ke pengolah kata ...
sumber
Untuk membaca semua bookmark dari PDF ke file teks, Anda dapat menggunakan perintah ini dengan
pdftk
:Saya kemudian menggunakan regex pada Notepad ++ untuk menghapus bagian tambahan. Berikut ini saya diganti dengan string kosong (berurutan), dan kemudian saya berakhir dengan daftar bookmark (jangan lupa ganti menggunakan regex di editor teks Anda):
Jika Anda ingin menghapus angka, ganti ungkapan ini:
sumber