Sebelum saya mulai menggunakan Ubuntu saya menggunakan Nitro PDF reader untuk secara otomatis mengekstrak gambar dari file PDF. Apakah ada pembaca PDF untuk Linux yang melakukan ini?
Saya ingin dapat mengekstraksi gambar lebih cepat / lebih mudah daripada saat mengambil foto.
pdfimages
melakukannya lebih baik / lebih buruk daripada NitroPDF?Jawaban:
Menggunakan
pdfimages
pdfimages
adalah alat ekstraktor gambar PDF yang menyimpan gambar dalam file PDF ke format PPM, PBM, JPEG atau JPEG 2000.Itu adalah bagian dari
poppler-utils
paket, yang harus Anda pasang.Pemakaian:
pdfimages [options] <PDF-file> <image-root>
Contoh: Berikut ini mengekstrak semua gambar dari file PDF, menyimpannya dalam format JPEG.
Akan menyimpan gambar dari file PDF
in.pdf
dalam file/tmp/out-000.jpg
(atau/tmp/out-000.pbm
; lihat di bawah)/tmp/out-001.jpg
,, dll.Halaman manual pdfimages menjelaskan:
sumber
-all Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files. This is equivalent to specifying the options -png -tiff -j -jp2 -jbig2 -ccitt.
-all
sakelar ini hanya didukung dalam revisi poppler-utils terbaru. Misalnya, jika Anda masih menggunakan 12,04, Anda tidak akan dapat mengakses opsi ini-all
go untuk format PNM. Mereka tidak rugi, dan Anda dapat memposting gambar misalnya ke PNG.$ pdfimages -list <PDF-file>
untuk memeriksa format asli di kolom "enc", jadi Anda tidak perlu menyandikan ulang gambar ke format lain.Saya sering menggunakan Inkscape untuk ini. Muat halaman, dan hapus semua hal lainnya. Keuntungannya adalah Anda bisa mendapatkan gambar vektor dalam SVG dan memodifikasinya sesuai pilihan Anda.
sumber
Saya memiliki file PDF dua kolom dengan gambar tertanam yang dibuat dengan LaTeX di mana gambar asli disediakan sebagai EPS. Saya mencoba solusi yang diusulkan berdasarkan
pdfimages
, tetapi sayangnya, tidak mengembalikan gambar. Saya kemudian mencoba menggunakan Inkscape, tetapi gambar SVG yang dihasilkannya terdistorsi dan saya juga tidak beruntung mengekspornya sebagai EPS.Perangkat lunak yang berfungsi untuk kami adalah MasterPdfEditor .
Inilah prosedurnya
Hasilnya berkualitas sangat tinggi, tetapi perangkat lunaknya tidak gratis. Ada versi demo yang "memungkinkan Anda untuk mencoba semua fitur," tetapi dilengkapi dengan "penambahan tanda air pada file output." Sejujurnya, saya tidak melihat tanda air di PDF yang diproduksi.
sumber
Anda juga dapat mencoba pdfmod. Ini adalah GUI (antarmuka grafis) yang dapat mengekstraksi gambar dan melakukan manipulasi pdf dasar lainnya.
sumber
Jika yang Anda butuhkan adalah gambar yang dipotong dalam format pdf / eps, kemudian ekstrak halaman dengan gambar menggunakan
pdfmod
(seperti yang disarankan oleh To Do).Kemudian menggunakan
pdfcrop
Anda dapat memotongnya dengan benar mengatur margin dengan coba-coba:sumber
Saya menggunakan pdfimages yang merupakan alat baris perintah dan ini berfungsi baik untuk saya. Sangat mudah digunakan dan Anda dapat menggunakan opsi --help untuk mempelajari lebih lanjut tentang penggunaannya. Saya menggunakan Ubuntu dan sudah diinstal sebelumnya. Jika file pdf Anda dienkripsi atau dilindungi kata sandi ada opsi untuk itu, jadi alat ini berfungsi dengan baik. Anda dapat membaca lebih lanjut tentang pdfimages di sini
sumber
Dengan pdfimages gambar yang diekstraksi dapat dalam dua atau lebih bagian. Cara sederhana untuk menyatukannya kembali tanpa khawatir tentang format yang diekstraksi adalah mengimpor bagian-bagian ke dalam LibreOffice Draw, memotong dengan dialog pemotongan gambar, memposisikan bagian-bagian, menyesuaikan ukuran halaman dan mengekspor dalam format apa pun yang Anda inginkan.
sumber
Jika Anda ingin memotong gambar dari pdf dengan pdfviewer, Anda dapat mencoba okular. Itu dapat memotong apa saja (teks atau gambar) dalam format png atau jpeg. Jika Anda ingin mengekstraksi gambar dalam format png dari pdf, Anda dapat melakukannya dengan perintah minimal dengan pdftohtml. Itu mengkonversi pdf ke html plus gambar. Di sini Anda dapat menemukan contoh - https://www.youtube.com/watch?v=CG1rf7k3xo8 . Jika Anda ingin mengekstraksi banyak gambar dari pdf, saya sarankan Anda untuk mencoba ini.
sumber
Perangkat lunak yang digunakan: Xreader OS: Antergos
Langkah:
sumber