Bagaimana cara saya menyimpan file gambar PDF sebagai gambar?

33

Saya memiliki PDF yang berisi gambar pindaian dokumen. Saya ingin menyimpan konten PDF ini sebagai gambar sehingga saya dapat menjalankannya melalui program OCR yang hanya menerima file tipe .jpg, .png, dan .gif.

Bagaimana cara saya menyimpan / mengonversi PDF ini ke salah satu format gambar itu?

EDIT: Salah satu cara yang saya temukan untuk melakukan ini adalah dengan mengklik pada setiap halaman. Menyalin ke clipboard. Tempel ke Paint.net lalu simpan. Namun, ini merepotkan karena tampaknya Anda hanya dapat memilih satu halaman pada Acrobat Reader.

Orang
sumber

Jawaban:

20

Mohon perhatikan jawaban pooryorick , di mana ia menunjukkan bagaimana jawaban sleske sebenarnya adalah jawaban yang jauh lebih baik untuk masalah khusus ini.


Gunakan GhostScript . Perintah ini bekerja untuk saya:

gs -dBATCH -dNOPAUSE -sDEVICE=png16m -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -r150 -sOutputFile=output%d.png input.pdf

Ada beberapa png pseudo-perangkat, membedakan pada kedalaman warna: pngmono, pnggray, png16, png256, png16m, dan pngalpha. Pilih yang mana yang paling cocok untuk Anda.

Anda juga dapat menggunakan jpeg, tetapi kecuali jika Anda memiliki masalah ruang disk, Anda ingin kualitas setinggi yang Anda bisa untuk OCR Anda, dan itu bukan jpeg.

GhostScript tidak lagi memiliki dukungan untuk gif, tetapi saya tidak dapat membayangkan mengapa Anda membutuhkannya, bagaimana dengan dukungan png256.

wfaulk
sumber
Saya suka GhostScript, dan jika Anda menginginkan kenyamanan GUI untuk mengatur opsi, melihat, dll, coba GSview pages.cs.wisc.edu/~ghost/gsview
Dennis
Apakah output akan menjadi satu gambar besar?
Xonatron
1
@Xonatron: Tidak. Satu gambar per halaman. Nama %dfile output adalah variabel yang diganti dengan nomor halaman. (Hampir pasti angka mentah, bukan angka di dalam PDF.)
wfaulk
20

Instal Imagemagick . Buka jendela atau terminal cmd:

convert myfile.pdf myfile.jpg

Outputnya akan menjadi 1 file jpg untuk setiap halaman di pdf Anda, test-0.jpg, test-1.jpg, dll.

DaveParillo
sumber
+1 untuk ImageMagick, tetapi -2 untuk menyarankannya untuk pekerjaan yang salah. JPEG baik untuk foto, tetapi ini adalah format terburuk untuk digunakan ketika Anda memiliki egdes tajam dan kontras tinggi (seperti yang biasanya Anda miliki dengan teks / karakter hitam pada latar belakang putih). Juga, ImageMagick tidak melakukan pekerjaan konversi itu sendiri, ia menggunakan Ghostscript di latar belakang sebagai budak "delegasi". Jadi melakukannya dengan Ghostscript secara langsung memberi Anda kontrol lebih besar atas parameter yang digunakan. Dan kemudian pilih TIFF (bukan JPEG) sebagai format output, demi chris!
Kurt Pfeifle
1
Catatan di windows, pastikan Anda menginstal Ghostscript 32-bit terlebih dahulu.
Pengguna
2
Waspadai tanda density,, depthdan qualitytanda yang dapat membantu Anda mengoptimalkan hasil. Misalnya: convert -density 300 -depth 8 -quality 85 a.pdf a.png Info selengkapnya
Nick
13

Ada juga pdfimagesdari alat Xpdf (tersedia dari situs XpdfReader ). Itu tidak akan mengkonversi seluruh halaman PDF ke gambar, melainkan akan mengekstraksi gambar yang tertanam dari PDF.

Ini berguna jika PDF berisi teks dan gambar, dan Anda hanya menginginkan gambar. Juga, itu akan mengekstraksi gambar dalam format aslinya, sehingga tidak ada kehilangan kualitas yang terlibat (tidak seperti program yang membuat seluruh halaman dan kemudian mengubahnya menjadi misalnya JPEG). Tergantung pada kebutuhan Anda, ini mungkin berguna.


Penggunaan sederhana:

pdfimages -j -list mydocument.pdf mydocument-images

Ini akan membaca file input mydocument.pdf, mengekstrak semua gambar dan menuliskannya ke file individual yang dinamai mydocument-images-0000.jpg, mydocument-images-0001.jpgdll.

Opsi -jmembuatnya menulis gambar yang dikompresi JPEG tertanam sebagai file JPEG, bukan sebagai file PBM / PGM / PPM (yang tidak terkompresi dan besar). Perhatikan bahwa gambar mungkin masih ditulis sebagai file PBM / PGM / PPM, jika demikian disimpan dalam file input PDF.

sleske
sumber
Sebagai referensi, penggunaan sederhana adalah pdfimages -j "yourinputfile.pdf" "outputimages"yang akan membuat "outputimages-0000.ppm" (atau "outputimages-0000.jpg" jika formatnya tepat). .NET contoh dapat dicangkokkan dari sini atau di sini
drzaus
Peringatan adalah bahwa itu mungkin tidak dapat menyimpan file sebagai JPG, melainkan PPM
drzaus
11

Anda dapat melakukan ini menggunakan adobe reader:

  1. Klik gambar. Itu akan disorot.
  2. Salin (Ctrl-C) dan tempel ke Paint.
  3. Simpan sebagai jenis file apa pun yang Anda suka.
Hemant
sumber
2
menarik untuk diketahui, Adobe Reader memiliki pengaturan untuk menimpa dpi gambar yang diambil dengan alat snapshot, ketika diatur ke 300dpi, Anda akan mendapatkan foto yang siap untuk dicetak (secara default resolusi layar diambil, yang umumnya terlalu rendah resolusinya) untuk digunakan kembali dalam pekerjaan lain)
Stijn Sanders
3
+1 untuk kesederhanaan. Sebagian besar pembaca PDF memungkinkan Anda melakukan ini.
Decio Lira
4
Bagaimana jika PDF Anda memiliki 10.000 halaman gambar? Apakah Anda harus melakukan ini sebanyak 10.000 kali?
Guy
9

Kecuali untuk jawaban yang menyebutkan gambar pdf, semua jawaban lainnya gagal menyebutkan bahwa solusi mereka benar-benar mentranskode gambar yang disematkan. Yaitu, solusi tersebut tidak hanya mengekstraksi gambar asli, tetapi memodifikasinya, mungkin dengan merusak gambar, selama proses. Hanya pdfimages yang mengekstrak gambar asli. Ini berlaku untuk Ghostscript, Imagemagick, Adobe Reader, PDFFill, PDF Xchange Viewer, OS X Preview, dan sebagian besar perangkat lunak PDF lainnya.

pooryorick
sumber
Mengingat konteks pertanyaannya, ini sebenarnya adalah poin yang sangat bagus.
wfaulk
FWIW, "PDFill PDF Tools" memang memungkinkan Anda untuk mengatur DPI untuk save-as-image, sangat praktis. Dengan demikian setiap halaman (mulai dari teks, gambar, objek apa pun) akan disimpan, misalnya, ke PNG beresolusi tinggi pada 4961x6520.
Chris O
4

PDFill PDF Tools mungkin adalah cara paling mudah untuk mengonversi PDF Anda ke gambar di Windows. Ini akan memungkinkan Anda mengekspor semua halaman dalam PDF untuk memisahkan gambar dalam satu pemotretan. Ini juga memiliki banyak fitur lain yang tersedia secara gratis, yang hanya tersedia di pemirsa PDF lainnya jika Anda membeli versi komersial atau "Pro".

Gunakan tombol "Konversi PDF ke Gambar" (tombol # 10) pada tangkapan layar di bawah ini.

PDFill tangkapan layar PDF Tools

Jika Anda perlu menggabungkan gambar menjadi satu gambar yang sangat tinggi sehingga Anda hanya perlu memberi makan satu file ke program OCR Anda, Anda dapat menggunakan IrfanView

rampok
sumber
perhatikan bahwa ini akan menginstal dua alat yang berbeda pada sistem Anda. Yang utama adalah Editor PDFill, yang mana Anda tidak perlu. Masuk ke menu mulai untuk membuka yang ini. Saya diselamatkan oleh tangkapan layar menyadari bahwa ada sesuatu yang salah sebelum saya mencopot pemasangan.
ufotd
Ya, saya kira saya gagal menyebutkan bahwa itu juga menginstal versi PDF Editor shareware, serta printer PDF. File apa pun yang dibuat dengan Editor PDFill akan memiliki tanda air kecuali Anda membeli editor seharga $ 19,99, tetapi utilitas PDFill PDF Tools Free tidak memerlukan pembelian apa pun. Dalam versi yang saya miliki, Anda tidak dapat menghapus Editor PDFill tanpa juga menghapus PDFill Alat PDF Gratis, tetapi menginstal Editor PDFill tidak membahayakan apa pun.
merampok
2

Karena Anda tidak menyertakan tag OS, saya akan menyertakan jawaban OSX:

PDF secara default terbuka di Preview.app yang memungkinkan Anda untuk menggunakan File -> Save-As:

  • GIF
  • ICNS
  • JPEG
  • JPEG-2000
  • BMP
  • OpenEXR
  • Photoshop
  • PNG
  • TGA
  • BERTENGKAR
Danau
sumber
1

Juga PDF Xchange Viewer (Gratis) akan melakukan ekspor-ke-file. File → Ekspor → Ekspor ke gambar.

Tidak hanya itu, tapi saya pikir itu adalah penampil PDF gratis terbaik untuk Windows, dan memiliki beberapa kemampuan markup yang bagus. Saya memiliki lisensi untuk Adobe Acrobat dan saya masih lebih suka ini kecuali saya melakukan pengeditan yang luas, yang jarang.

wfaulk
sumber
Ini tampak menjanjikan, sampai saya menemukan bahwa opsi untuk mengekspor ke gambar dinonaktifkan untuk PDF yang diamankan dengan kata sandi.
Mitch
1

(Tidak gratis) Acrobat professional melakukan ini:

Lanjutan-> Pemrosesan Dokumen-> Ekspor semua gambar ...

ufotd
sumber
0

Jika file kurang dari 5MB dan Anda tidak khawatir tentang privasi / kerahasiaan, maka itu adalah layanan online yang praktis di http://www.go2convert.com/ yang dapat melakukan banyak konversi grafis (termasuk pdf ke jpeg)

sgmoore
sumber
Baru saja mencoba dan memberi pesan kesalahan ini "Maaf! Gambar ini tidak dapat dikonversi dengan benar."
Guy
-1

Jika gambar melebihi ukuran layar Anda, Anda dapat menggunakan FastStone Capture (fitur "Capture Scrolling Window") dan menyimpan gambar sebagai JPEG.

teks alternatif

Taji
sumber
Itu cara yang sangat tidak langsung untuk mengambil gambar. OP sudah memiliki solusi yang lebih baik (tandai halaman di Acrobat).
sleske