Bagaimana cara menghapus tanda air dari file PDF?

41

Saya pikir ini akan menjadi tugas yang sederhana, tetapi ternyata sebaliknya.

Tanda air adalah gambar yang sama (tumpang tindih, tetapi transparan) pada setiap halaman. Saya membuat file PDF sendiri (jadi tidak ada kekhawatiran hak cipta di sini) menggunakan PDFCreator 0.9.8.

Saya sudah mencoba Adobe Acrobat Pro teman saya, tetapi tidak berhasil. Mencoba menghapusnya, tetapi tidak bisa. Saya mencoba untuk menghapus header / footer, dll, tetapi tanda air tidak akan hilang.

Bagaimana cara menghapus tanda air?

Apache
sumber
2
PDF adalah format output, seperti halaman cetak elektronik. Itu tidak dimaksudkan untuk diedit, dan dalam banyak kasus Anda tidak akan dapat melakukan apa yang Anda minta, tidak mengekspor halaman ke gambar dan pemotretan menghilangkan tanda air.
mk12
Rekomendasi belanja di luar topik untuk semua situs web pertukaran tumpukan. Untuk mencegah penutupan pertanyaan ini, saya akan merekomendasikan untuk mengubahnya menjadi pertanyaan bagaimana, alih-alih yang mana
Luke Kanada REINSTATE MONICA
3
Tampaknya Anda hanya akan menggunakan PDFCreator 0.9.8 dan mengatur opsi sehingga tanda air TIDAK ditambahkan ke setiap halaman. Saya menganggap pertanyaan ini karena Anda tidak memiliki sumber aslinya.
Ramhound

Jawaban:

73

Untuk tanda air berbasis gambar, ada beberapa alat yang menjanjikan penghapusan otomatis mereka. Sebagai contoh:

Semua ini gratis untuk dicoba, tetapi memerlukan lisensi untuk benar-benar menghasilkan output yang diinginkan.

Namun, tanda air dari file PDF khusus ini (yang dikirim OP kepada saya melalui email) bukanlah gambar tunggal yang diulang pada semua halaman. Ternyata, PDFCreator hardcode itu (hampir pixel demi pixel) ke masing-masing dari mereka. Ini membuat tanda air jauh lebih sulit untuk dihapus (dan menghasilkan file PDF yang agak membengkak).

Karena tanda air sebenarnya terdiri dari banyak gambar kecil, Anda dapat menghapusnya dengan editor PDF (mis., Foxit Advanced PDF Editor ), cukup dengan memilihnya dan menekan Delete. Sayangnya, Anda harus mengulang ini untuk setiap halaman.

Solusi yang kurang memakan waktu adalah dengan menghapus tanda air secara terprogram. Kita butuh:

Tangga

  1. Unduh Pdftk dan ekstrak pdftk.exe dan libiconv2.dll ke % windir% \ System32 , direktori di jalur atau lokasi lain pilihan Anda.

  2. Unduh dan pasang Notepad ++.

  3. Streaming PDF biasanya dikompresi menggunakan algoritma DEFLATE . Ini menghemat ruang, tetapi membuat sumber PDF tidak terbaca.

    Perintah

    pdftk original.pdf output uncompressed.pdf uncompress
    

    membuka kompresi semua aliran, sehingga dapat dimodifikasi oleh editor teks.

  4. Buka uncompressed.pdf dengan Notepad ++ untuk mengungkap struktur tanda air.

    Dalam kasus khusus ini, setiap halaman dimulai dengan blok

    q 9 0 0 9 2997 4118.67 cm
    BI
    /CS/RGB
    /W 1
    /H 1
    /BPC 8
    ID Ÿ®¼
    EI Q
    

    dan hampir 4.000 blok seperti ini. Blok khusus ini hanya menetapkan satu ( /W 1 /H 1) piksel watermark.

    Menggulir ke bawah hingga perubahan pola menunjukkan bahwa aliran watermark adalah 95,906 byte (menghitung baris baru). Aliran yang sama persis diulang pada setiap halaman file PDF.

  5. Tekan Ctrl+ Hdan atur yang berikut ini:

    Find:               q 9 0 0 9 2997 4118\.67 cm.{95881}
    Replace:            (blank)
    Match case:         checked
    Wrap around:        checked
    Regular expression: selected
    . matches newline:  checked
    

    Ekspresi reguler q 9 0 0 9 2997 4118\.67 cm.{95881}cocok dengan baris pertama dari blok di atas ( q 9 0 0 9 2997 4118.67 cm) dan semua yang mengikuti 95.881 karakter, yaitu aliran watermark.

    Mengklik Ganti Semua menghapusnya dari semua halaman file PDF.

  6. Tanda air sekarang telah dihapus, tetapi file PDF memiliki kesalahan (panjang aliran tidak benar) dan tidak terkompresi.

    Perintah

    pdftk uncompressed.pdf output nowatermark.pdf compress
    

    mengurus keduanya.

  7. uncompressed.pdf tidak lagi diperlukan. Anda bisa menghapusnya.

Hasilnya adalah PDF yang sama tanpa tanda air (dan sekitar setengah ukuran).

Dennis
sumber
4
Trik lain yang menurut saya berguna: Sulit bagi saya untuk mengetahui blok yang sesuai dengan tanda air di PDF saya. Jadi yang saya lakukan hanyalah mengekstrak satu halaman dari PDF, idealnya sebuah halaman di mana hanya ada tanda air dan tidak banyak lagi. Dari satu halaman ini saja, akan lebih mudah untuk mengetahui blok yang sesuai dengan tanda air. Kemudian kembali dan lakukan itu untuk PDF asli.
Kenny LJ
1
Wow, ini adalah tempat pertama di internet yang saya temukan cara yang baik untuk mengelola ini. Adakah tempat yang Anda rekomendasikan untuk membaca tentang format wadah?
ConstantineK
2
@hob IIRC, saya membaca bagian dari referensi PDF resmi untuk menulis jawaban ini.
Dennis
1
Terima kasih @ Dennis, saya sudah memberi Anda upvote, tetapi ini tampaknya menjadi sumber kanonik terbaik. Saya bisa mendapatkan apa yang saya butuhkan dengan hanya mencari / mengganti dan beberapa percobaan kompresi dan menjalankan kesalahan tambahan. BANTUAN BESAR!
ConstantineK
7
Alih-alih pdftkAnda juga dapat menggunakan qpdf untuk mengompres dan mengompres file pdf. Perintah: qpdf --stream-data=uncompress original.pdf uncompressed.pdfdanqpdf --stream-data=compress uncompressed.pdf nowatermark.pdf
David Schuler
6

Kedengarannya tanda air sebenarnya adalah bagian dari gambar di dalam .PDF, dan bukan gambar terpisah yang dibuat olehnya dengan apa pun yang Anda gunakan untuk menampilkan .PDF. Anda mungkin tidak dapat menghapus tanda air tanpa mengekstraksi gambar dari .PDF, menjalankannya melalui editor gambar, dan kemudian merekonstruksi .PDF secara manual.

LawrenceC
sumber
4

Untuk tanda air teks, mengedit versi PostScript bisa jauh lebih mudah: Setelah

$ pdftops document.pdf

edit document.ps, lalu konversikan kembali ke PDF melalui

$ ps2pdf document.ps

Heiner
sumber
Di Linux, waspadalah pdftopsdan pdf2psberbeda. Gunakan perintah pertama, bukan yang kedua.
Camille Goudeseune
1
Jika Anda tahu apa teks watermark itu, berikut adalah satu-liner. pdftops in.pdf - | sed 's/WATERMARK//' | ps2pdf - out.pdf
Camille Goudeseune
1

Artefak prangko adalah bahwa Anda dapat menghapusnya di dalam Adobe Acrobat Pro, namun itu dibuat kembali pada gerakan mouse karena objek stream membuatnya tetap persisten.

Jika Anda mencoba mengedit sumber pdf - yang rumit, ada kemungkinan file akan rusak.

Jika cap adalah aliran, kita dapat menghentikannya dengan memutus sambungan komputer dari Internet, yang saya lakukan.

Kemudian menggunakan Adobe Acrobat Pro, saya memilih salah satu anotasi saya, klik kanan untuk mendapatkan popup, dan memilih "Tampilkan Daftar Komentar".

Pilih tanda air jahat / cap dari Daftar, klik kanan untuk mendapatkan popup dan pilih "Hapus". Lakukan ini pada setiap halaman di mana afiksasi terjadi.

Simpan File dengan nama lain. Aplikasi saya macet, tetapi tidak sebelum menyimpan file!

Buka file baru & jauh lebih kecil; Perhatikan bahwa semua tanda air / perangko adalah gonzo.

Dalam kasus saya, ukuran file dokumen 3 halaman saya menyusut dari 300 kb ke 60 kb yang mengesankan. Semua data asli dan anotasi tetap utuh - tanpa tanda air.

~ Perburuan yang baik: o)

Alan Hord
sumber
1

konversi dokumen menjadi file .rtf menggunakan zamzar. Tanda air menghilang secara otomatis setelah konversi. Harap Catatan: - Ini berfungsi dengan baik jika dokumen berisi bahan teks. Itu selalu sangat membantu .. (pengguna Mac)

Shifa
sumber
Ini tidak berfungsi untuk PDF yang saya coba.
Kenny LJ
1

Menemukan cara lain untuk melakukannya:

  1. Gunakan alat pdf2htmlEX (atau pengonversi PDF ke HTML lainnya) untuk mengonversi PDF ke file HTML.
  2. Edit HTML dengan editor teks, dan hapus tanda air. Simpan itu.
  3. Cetak ke HTML ke dokumen PDF baru
  4. Keuntungan
Dominik Antal
sumber
Terima kasih. Apakah Anda yakin tidak dapat menghapus tanda air dengan Adobe Acrobat dengan cara ini? (Yang ini mungkin memang solusi yang lebih murah.)
Apache
Saya yakin Anda memerlukan semacam kata sandi untuk menghapus tanda air di dalam Adobe reader, maka saya menggunakan metode ini.
Dominik Antal
0

Ini adalah suplemen untuk jawaban @ Dennis 'dari 18:06 30 Jul 2012. Dia tentu menangani kasus yang lebih sulit.

Dalam kasus paling sederhana di mana tanda air sederhana, teks tanpa hiasan, misalnya

Smedley Sebagai Komisaris

tanda air PDF terkompresi dapat didefinisikan seperti ini:

    BT
    75.96 625 Td
    (Smedley For Commissioner)Tj
    ET

di mana 75.96offset horizontal dan 625offset vertikal untuk instance watermark khusus ini. (Ya, bilangan real dan bilangan bulat dapat dilihat.)

Regexp seperti berikut ini akan bekerja untuk semua tanda air tersebut, mengabaikan variasi dalam penempatan mereka:

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n

Ketahuilah, bahwa berbagai operator PDF yang memodifikasi dapat ikut bermain dengan tanda air yang memiliki format lebih rumit. Kemewahan seperti itu dapat mengubah apa yang diharapkan oleh pembaca (harapan?) Menjadi string yang berdekatan dan mudah dicari menjadi kekacauan sup alfabet. Sebagai contoh,

E 1 = mc² oleh Smedley ™

Mungkin produk ini:

    BT
    75.96 625 Td
    (E)Tj
    -5 Ts
    (1)Tj
    0 Ts
    ( = mc)Tj
    5 Ts
    (2)Tj
    0 Ts
    (by Smedley)Tj
    5 Ts
    (TM)Tj
    0 Ts
    ET

. . . atau jauh lebih buruk jika tanda air Anda ditingkatkan warna!

Setelah mencatat semua ini, saya juga akan mencatat bahwa PDFtk memiliki versi GUI yang dimaksudkan untuk menangani tanda air, dengan pertimbangan biaya lisensi $ 4. Tidak mahal sama sekali!

Di sisi lain, saya menemukan situs webnya saat ini mengiklankan dukungan penuh untuk O / S melalui Windows 8dan OS X 10.8 Mountain Lion. Vintage itu sudah lebih dari 4 tahun yang lalu. Mungkinkah PDFtk menjadi usang? Saya kira tidak, tapi saya tidak tahu.

Der Schley
sumber
Terima kasih atas rekomendasi PDFtk, terlihat rapi, tapi ya juga "berbau" sedikit oudated. Versi gratisnya adalah 2.02, dan Wikipedia mengatakan itu memang dirilis 3 tahun lalu: en.wikipedia.org/wiki/PDFtk
Apache
1
@Shiki - sebenarnya, saya melakukan penelitian serius dalam format PDF, tetapi membatalkan penilaian terperinci saya tentang kemajuan PDF dalam 10 tahun terakhir. Berikut ringkasannya: "Kekurangan rilis 3tahun PDFtk sehubungan dengan pengembangan spesifikasi PDF." Meskipun ada beberapa pembaruan sejak, katakanlah, 2005, _Anda akan baik-baik saja dengan _PDFtk_ dalam semua kemungkinan._ Saya mengatakan ini setelah memeriksa beberapa sumber dokumen PDF modern yang tersedia. Semua dokumen PDF yang saya periksa dibuat dengan standar PDF pra-2010 ( jauh sebelum, sebenarnya.) Jika Anda ragu, periksa beberapa lusin byte teratas dari file PDF yang dimaksud.
Der Schley
0

Berikut cara gratis dan berbayar untuk melakukannya, saya sarankan Anda menggunakan Google Drive.

Google Drive memiliki kemampuan untuk membuka file dan melakukan beberapa pengeditan kecil. Selain itu, dapat digunakan untuk menghapus tanda air dari PDF online.

  1. Buka akun Google Drive Anda, yang pada dasarnya sama dengan akun Gmail Anda.
  2. Klik "Baru"> "Unggah file", pilih dokumen PDF lalu unggah.
  3. Setelah selesai, Anda dapat memeriksa file yang diunggah di Drive Anda, lalu klik kanan untuk membukanya dengan "Google Documents".
  4. Setelah itu, tanda air Anda akan dihapus secara otomatis. Untuk menyimpannya, buka "File" dan klik "Unduh sebagai" dan kemudian pilih "dokumen PDF".
Crystal Wang
sumber