Linux — perintah untuk menghapus gambar dari pdf

0

Saya punya pdf, yang sangat besar karena diekspor dari photoshop dan saya tidak bisa membukanya. Ini berisi teks, saya suka menyalin / menempel.

Apakah ada perintah untuk menghapus semua gambar dari pdf dan menyimpan hasilnya sebagai file baru?

Btw. Saya sudah mencoba pdftotext, tetapi file yang dihasilkan berantakan, garis dipecah menjadi maksimal 10 karakter, semua banyak spasi dan sebagainya

MEMPERBARUI

Saya menemukan utas yang bagus sini tetapi tidak ada solusi yang berhasil, jadi saya kira »photoshop pdf« benar-benar kacau…

philipp
sumber

Jawaban:

1

Bergantung pada teks yang ingin Anda ekstrak, mungkin lebih baik dijalankan pdf2txt di atasnya.

eckes
sumber
itu lebih baik, tetapi masih ada beberapa hal aneh di dalamnya, saya kira beberapa urutan melarikan diri seperti: Di(cid:249)erent di dalamnya ... Tapi terima kasih atas jawabannya!
philipp