Adakah yang punya rekomendasi atau prosedur untuk memperbaiki PDF yang rusak? Ketika saya membuka file saya mendapatkan "Ada kesalahan membuka dokumen ini. File tersebut rusak dan tidak dapat diperbaiki." Tampaknya ada banyak sekali alat di luar sana tetapi tidak ada yang bisa saya gambarkan sebagai yang memiliki reputasi baik. Apakah ada solusi berbasis linux opensource untuk ini?
pdf
repair
ghostscript
Tim Alexander
sumber
sumber
Jawaban:
Ghostscript akan memperbaiki PDF Anda yang rusak secara otomatis ... jika dapat membukanya di awal (artinya, jika tidak rusak, tidak dapat diperbaiki). Tetapi setelah itu Anda masih perlu memeriksa ulang hasilnya ...
Di Linux, coba perintah ini:
Di Windows, coba yang ini:
sumber
Saya memiliki file PDF yang rusak
print.pdf
,, yang Ghostscript tidak dapat membuka, tetapi pemirsa Linux Linux grafis biasa (Okular, Evince) dibuka dengan baik. (Dalam kasus saya, file memiliki sampah di awal alih-alih header PDF, ketika dibuka di hex editor.)Pemirsa PDF ini menggunakan Poppler sebagai renderer PDF back-end. Jadi, Anda dapat memperbaiki PDF menggunakan alat baris perintah Poppler. Di Ubuntu ini ada dalam
poppler-utils
paket. Saya menggunakan:yang menghasilkan file PDF dengan tajuk yang benar, yang alat seperti Ghostscript sekarang diterima.
sumber
mutool
( halaman proyek , halaman manual ) akan memperbaiki PDF yang rusak tanpa mencetaknya .sudo apt-get install mupdf-tools
mutool clean input.pdf output.pdf
Sebagai alternatif, ada beberapa alat dan kerangka kerja yang dapat menguraikan / mendekompilasi PDF ke dalam komponen mereka tanpa merendernya. Ini bisa berguna untuk mengekstraksi teks, skrip, dan gambar. Lihat jawaban ini untuk daftar alat-alat semacam itu: https://reverseengineering.stackexchange.com/q/1526/8210 . Misalnya Anda dapat mencoba jawaban teratas Origami saat ini , ia memiliki penampil berbasis GTK.
sumber
mutool clean
tidak memperbaiki semua kemungkinan kesalahan. Saya memiliki file yang memiliki berbagai kesalahan pada font dan aliran konten, dan mutool akan menyimpan kesalahan tersebut.Saya memiliki file pdf yang rusak, karena file php yang digunakan untuk mengunduhnya mengulangi beberapa kesalahan (dalam HTML) dan karakter NUL pada akhirnya.
Solusinya adalah membuka pdf dengan Notepad ++ dan menghapus semua teks setelah baris
sumber
%%EOF
. Saya menghapus semuanya setelah yang pertama%%EOF
menggunakan hex editor. Sekarang semuanya bekerja dengan baik.