Saya memiliki file PDF yang berisi peta gedung tempat saya bekerja, di sini:
http://www.libsys.und.edu/dev/FloorPlans_All.pdf
File sumber asli telah hilang, dan saya diminta untuk mengekstrak gambar peta, lebih disukai tanpa teks dan ikon yang telah di-overlay di atasnya. Ini terbukti sangat sulit.
Sejauh ini, saya telah mencoba program GUI berikut:
- Adobe Reader: memungkinkan saya memilih teks, tetapi bukan gambar latar belakang
- FoxIt PDF Viewer: memungkinkan saya memilih teks, tetapi bukan gambar latar belakang
- XPDF di Ubuntu 10.10: memungkinkan mes memilih teks, tetapi bukan gambar latar belakang
Dan juga program-program command-line berikut:
- pdfimages: mengekstrak ikon yang menunjukkan kamar mandi baik-baik saja, tetapi bukan gambar latar belakang
- pdftohtml: sama seperti pdfimages, ditambah itu membuat dokumen HTML yang ditandai dengan buruk
- pdfextract: sama seperti pdfimages
- convert: gambar berhasil disimpan, tetapi dengan teks dibakar ke dalamnya
Saya bahkan sudah mencoba membuka PDF secara manual dalam editor teks dan mengekstraksi objek stream dengan menempelkannya ke file baru dan menyimpannya dengan ekstensi .jpg, .png, atau .bmp (masing-masing pada gilirannya). Mengingat betapa sedikitnya yang saya ketahui tentang struktur internal file PDF, tidak mengherankan bahwa ini tidak berhasil.
Jadi ... apakah ada cara saya dapat mengambil gambar peta dari benda ini tanpa juga mendapatkan teks dan ikon?
sumber
qpdf
untuk mengubah bagian biner menjadi ASCII sejauh mungkin. (2) Gunakan editor teks untuk membuat semua teks tidak terlihat yang tidak ingin saya lihat di layar atau di cetakan (dapat dicapai dengan mudah dan tanpa merusak tabel XRef dengan mengibarkan bendera yang tidak terlihat ). (3) Distilasi ulang hasil dengan Ghostscript untuk mereduksi ukurannya sebanyak mungkin. - Sayangnya, file Anda tidak lagi dapat diunduh untuk menunjukkan prosedur ...Jawaban:
Anda dapat mengunduh perpustakaan XPDF dari http://www.foolabs.com/xpdf/download.html untuk Linux dan Windows. Kemudian jalankan
pdfimages -j input.pdf output
dan Anda harus mendapatkanoutput-000.jpg
,output-001.jpg
, dll Juga, periksa http://linuxcommand.org/man_pages/pdfimages1.html untuk pilihan penggunaan.sumber
Ok, setelah bermain-main dengan ini selama 5 menit, analisis saya adalah bahwa PDF bahkan lebih aneh dari yang saya kira, dan itu mengatakan sesuatu.
Tidak yakin berapa anggaran Anda, tetapi dengan Acrobat Pro Extended 9, Anda dapat menggunakan:
A. Alat, Pengeditan Lanjutan, Alat Teks Touchup
B. Alat, Pengeditan lanjutan, Alat Objek Touchup
-Pilih objek (Anda bisa mendapatkan sebagian besar, tetapi tidak semua, dari mereka (misalnya ikon komputer siswa tidak dapat dipilih), lalu hapus
Seperti apa tampilan Halaman 1 setelah pembersihan cepat: http://dl.dropbox.com/u/7434256/p1test.pdf
sumber
/AA
operator (untuk Tindakan Otomatis ) menjadikannya file PDF yang berpotensi berbahaya. Ghostscript dapat membuatnya hingga 60 kByte tanpa kehilangan konten yang terlihat. (Metadata yang terkandung dalam file tersebar di 17 objek berbeda. Metadata juga menyarankan ada 17 revisi / modifikasi berbeda dari file tersebut sejak dibuat pada 2011-01-18.)Ambil PDF yang dibuat oleh Craig H dan optimalkan sedikit dengan menjalankannya melalui Ghostscript. Pada Windows, perintahnya adalah:
Di Linux / Unix / Mac OS X lakukan:
Ini akan menurunkan ukuran file dari 3.000 kByte menjadi sekitar 60 kByte tanpa kehilangan konten. Kemudian mengimpornya ke Inkscape (atau InDesign, Illustrator, ...) harus lebih cepat ....
sumber
... Anda dapat mencoba Photoshop. Bunyinya PDF, dan itu 'mungkin' itu berasal dari PS dan mungkin masih memiliki lapisan ... tapi itu tembakan yang sangat panjang.
sumber
Dalam lingkungan Linux saya telah menggunakan pdfmod untuk mengekstraksi semua gambar dalam sekali jalan. Lihat https://wiki.gnome.org/Apps/PdfMod atau, untuk pengguna Ubuntu, https://apps.ubuntu.com/cat/applications/pdfmod/
Untuk mengunduh dan menginstalnya di Ubuntu, cukup mengetik
sudo apt-get install pdfmod
.pdfmod
dashboard atau terminal baris perintah)export n images
, dengan n nomor yang sesuai). Anda juga dapat mengakses perintah ini dengan mengarahkan mouse Anda pada pilihan dan mengaktifkan menu lokal (klik kanan untuk yang kidal).Semoga ini membantu.
sumber
Buka dokumen di layar Anda, perbesar gambar untuk membuatnya sebesar mungkin tetapi semuanya masih terlihat. Tekan alt + prnt scrn (atau yang setara pada sistem operasi Anda) dan itu harus mengambil screenshot program. Sekarang buka cat atau editor gambar favorit Anda (photoshop, gimp, dll) tempel di gambar dan memotong apa pun yang tidak Anda inginkan.
sumber