Bagaimana cara menghapus watermark dari pdf menggunakan pdftk?

33

Saya perlu menghapus beberapa tanda air email bodoh yang mengembang di semua halaman buku domain publik. Saya melihat halaman manual pdftk dan beberapa contoh tetapi masih tidak tahu bagaimana cara menghapus tanda air. Saya menghargai petunjuk Anda.

hnns
sumber

Jawaban:

35

tugas yang sangat sederhana untuk dilakukan:

gunakan sed:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf

tapi, setelah itu, pastikan untuk memperbaiki pdf keluaran yang dihasilkan

pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

semua menjadi satu perintah:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf && pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

tanda air teks tidak lain adalah teks antara dua tag di dalam kode terkompresi pdf

Dingo
sumber
1
Fantastis! bekerja seperti pesona. harap ganti nama alamat email menjadi alamat fiktif. Saya tidak ingin orang itu dimanja buku yang menjadi sasaran para spammer. Khususnya karena dia mungkin orang yang membuat pdf. Terimakasih banyak.
hnns
selesai! Mengubah string spesifik dengan string generik
Adakah yang tahu cara memodifikasi solusi ini untuk menghilangkan tanda air tautan? Saya menyingkirkan teks, tetapi masih ada kotak kecil yang tersisa di mana teks itu dulu.
425nesp
pdftk crash ketika saya menjalankan ini.
Cerin
@Dingo bagaimana proses batch itu? Maksud saya banyak file
Clain Dsilva
49

Sedikit add-on untuk jawaban Dingo karena tidak berhasil untuk saya:

Pertama-tama saya harus membuka kompresi dokumen PDF agar dapat menemukan tanda air dan menggantinya dengan sed. Langkah pertama melibatkan membuka kompresi dokumen PDF menggunakan pdftk:

pdftk original.pdf output uncompressed.pdf uncompress 

sekarang, uncompressed.pdfdapat digunakan seperti dalam jawaban Dingo:

sed -e "s/watermarktextstring/ /" uncompressed.pdf > unwatermarked.pdf

Saya kemudian memperbaiki dan mengkompresi ulang dokumen:

pdftk unwatermarked.pdf output fixed.pdf compress
Philippe
sumber
Anda adalah penyelamat hidup! Terima kasih!!! :)
johndodo
1
Ini sangat mengagumkan!
qed
4
Saya mengambil proses ini, membuatnya sedikit lebih keren, dan membungkusnya dengan skrip Python. Ada di github di sini .
Alexander Garden
@Alexander Garden Tidak berfungsi, TypeError: str() takes at most 1 argument (2 given)bila digunakan mengikuti saran penggunaan yang diberikan
8bitjunkie
2
Tidak bekerja untuk menghilangkan tanda air yang ditambahkan oleh Master PDF Editor.
fccoelho
-2

Untuk menghapus www.it-ebooks.info,

buka PDF di notepad ++ atau textpad

ganti www.it-ebooks.info dengan apa-apa (kosong)

simpan file

Buka di pembaca adobe standar

Keluar, Anda akan diminta untuk menyimpan file

Simpan itu

pengguna549273
sumber
1
Apakah ini solusi umum? Apa itu www.it-ebooks.info?
Karlo