Saya mencoba menggunakan program baris perintah convert
untuk mengambil PDF menjadi gambar (JPEG atau PNG). Ini adalah salah satu PDF yang saya coba konversi.
Saya ingin program untuk memangkas kelebihan white-space dan mengembalikan gambar berkualitas cukup tinggi sehingga superskrip dapat dibaca dengan mudah.
Ini adalah upaya terbaik saya saat ini . Seperti yang Anda lihat, pemangkasan berfungsi dengan baik, saya hanya perlu sedikit mempertajam resolusi. Ini adalah perintah yang saya gunakan:
convert -trim 24.pdf -resize 500% -quality 100 -sharpen 0x1.0 24-11.jpg
Saya sudah mencoba membuat keputusan sadar berikut:
- ubah ukurannya lebih besar (tidak berpengaruh pada resolusi)
- buat kualitas setinggi mungkin
- gunakan
-sharpen
(saya sudah mencoba berbagai nilai)
Setiap saran, mohon untuk mendapatkan resolusi gambar di PNG / JPEG akhir yang lebih tinggi akan sangat dihargai!
pdf
imagemagick
JBBahkan lebih lanjut
sumber
sumber
sips
, "sistem pemrosesan gambar skrip". Ini adalah editor gambar baris perintah bawaan untuk macOS, berfungsi pada PDF dan banyak jenis gambar lainnya.Jawaban:
Tampaknya berfungsi sebagai berikut:
Ini menghasilkan gambar kiri . Bandingkan ini dengan hasil perintah asli saya ( gambar di sebelah kanan ):
(Untuk benar-benar melihat dan menghargai perbedaan di antara keduanya, klik kanan pada masing-masing dan pilih "Buka Gambar di Tab Baru ..." .)
Ingat juga fakta-fakta berikut:
Jadi, tidak perlu mengubah ukuran; tambahkan
-density
bendera. Nilai kepadatan 150 aneh - mencoba berbagai nilai menghasilkan gambar yang tampak lebih buruk di kedua arah!sumber
density
parameter adalah sedikit khusus di dalam harus datang sebelum file input. Karena PDF adalah format file berbasis vektor yang tidak memiliki (banyak) gagasan piksel, ia mengatakan sesuatu seperti "halaman adalah 8in oleh 12in". Jika Anda ingin piksel, Anda menggunakandensity
pengaturan untuk memberi tahu, berapa banyak piksel per inci yang ingin Anda dapatkan dalam output. E. g. dengan 150 Anda akan mendapatkan 8x150 = 1200 dengan 12x150 = 1800 piksel pada gambar yang dihasilkan. Itu juga jumlah piksel yang dipertajam, kontras, kompresi dll pengaturan bekerja.-flatten
.-density
dan-flatten
untuk mengurangi ukuran pdf (ke pdf lain). The-flatten
pilihan yang sangat banyak membantu dalam mengurangi ukuran total. Dalam kasus saya, tanpa gangguan visual.-density
bendera kemungkinan akan memberikan hasil yang lebih buruk pada nilai yang lebih tinggi jika kualitas gambar mulai lebih rendah dari itu.Secara pribadi saya suka ini.
Ini sedikit lebih dari dua kali ukuran file, tetapi terlihat lebih baik bagi saya.
-density 300
menyetel dpi tempat PDF diberikan.-trim
menghapus piksel tepi apa pun yang warnanya sama dengan piksel sudut.-quality 100
mengatur kualitas kompresi JPEG ke kualitas tertinggi.Hal-hal seperti
-sharpen
tidak berfungsi dengan baik dengan teks karena mereka membatalkan hal-hal yang dilakukan sistem rendering font Anda agar lebih mudah dibaca.Jika Anda benar-benar ingin itu meledak gunakan mengubah ukuran di sini dan mungkin nilai dpi yang lebih besar dari sesuatu seperti
targetDPI * scalingFactor
Itu akan membuat PDF pada resolusi / ukuran yang Anda inginkan.Deskripsi parameter di imagemagick.org ada di sini
sumber
convert
bagaimana kita akan tahu berapa banyak halaman yang dikonversi?-sharpen
. Kualitasnya jauh lebih baik daripada dengan default dan jauh lebih alami daripada dengan-sharpen
.Saya menggunakan
pdftoppm
pada baris perintah untuk mendapatkan gambar awal, biasanya dengan resolusi 300dpi, jadipdftoppm -r 300
, kemudian gunakanconvert
untuk melakukan pemangkasan dan konversi PNG.sumber
pdftoppm
juga dapat menampilkan JPEG dan PNG.biasanya saya mengekstrak gambar yang disematkan dengan 'pdfimages' pada resolusi asli, kemudian menggunakan konversi ImageMagick ke format yang diperlukan:
ini menghasilkan file hasil terbaik dan terkecil.
Catatan: Untuk gambar tersemat JPG yang hilang, Anda harus menggunakan -j:
Dengan poppler baru-baru ini Anda dapat menggunakan -semua yang menyelamatkan lossy sebagai jpg dan lossless sebagai png
Pada sedikit platform Win yang disediakan Anda harus mengunduh biner 'poppler-util' terbaru dari (0,37 2015) dari: http://blog.alivate.com.au/poppler-windows/
sumber
pdftoppm
tidak denganpdfimages
Saya telah menemukan keduanya lebih cepat dan lebih stabil ketika batch-processing PDF besar menjadi PNG dan JPG untuk menggunakan perintah yang mendasari
gs
(alias Ghostscript) yangconvert
digunakan.Anda dapat melihat perintah di output
convert -verbose
dan ada beberapa tweak mungkin di sana (YMMV) yang sulit / tidak mungkin diakses secara langsung melaluiconvert
.Namun, akan lebih sulit untuk melakukan pemangkasan dan penajaman Anda menggunakan
gs
, jadi, seperti yang saya katakan, YMMV!sumber
Ini juga memberi Anda hasil yang baik:
sumber
Pengguna Linux di sini: Saya mencoba
convert
utilitas baris perintah (untuk PDF ke PNG) dan saya tidak puas dengan hasilnya. Saya menemukan ini lebih mudah, dengan hasil yang lebih baik:pdftk file.pdf cat 3 output page3.pdf
GIMP
Resolution
dari100
ke300
atau600 pixel/in
GIMP
ekspor sebagai PNG (ubah ekstensi file menjadi .png)Edit:
Menambahkan gambar, seperti yang diminta di
Comments
. Perintah konversi yang digunakan:convert -density 300 -trim struct2vec.pdf -quality 100 struct2vec.png
GIMP
: diimpor pada 300 dpi (px / in); diekspor sebagai level kompresi PNG 3.Saya belum pernah menggunakan GIMP pada baris perintah (re: komentar saya, di bawah).
sumber
convert
. Saya hanya melihat bagian dari jawaban ini yang menyebutkanconvert
dan pertanyaan Anda saat membaca komentar otomasi Anda. Terima kasih atas jawaban Anda nanti di utas ini, yang saya kombinasikan dengan solusi yang saya tautkan dan memecahkan masalah berbeda yang saya alami.Saya benar-benar tidak memiliki kesuksesan yang baik dengan
convert
[pembaruan Mei 2020: sebenarnya: itu hampir tidak pernah berhasil untuk saya], tetapi saya sudah sukses dengan SANGAT BAIKpdftoppm
. Berikut adalah beberapa contoh menghasilkan gambar berkualitas tinggi dari PDF:[Menghasilkan ~ 25 MB ukuran file per pg] Output format file .tif tanpa kompresi pada 300 DPI ke dalam folder yang disebut "gambar", dengan file yang diberi nama pg-1.tif , pg-2.tif , pg-3.tif , dll:
[Menghasilkan ~ file berukuran 1MB per pg] Output dalam format .jpg pada 300 DPI :
[Menghasilkan ~ file berukuran 2MB per pg] Output dalam format .jpg dengan kualitas tertinggi (kompresi terendah) dan masih pada 300 DPI :
Untuk penjelasan, opsi, dan contoh lainnya, lihat jawaban lengkap saya di sini:
/ubuntu/150100/extracting-embedded-images-from-a-pdf/1187844#1187844 .
Terkait:
pdf2searchablepdf
] /ubuntu/473843/how-to-turn-a-pdf-into-a-text-searchable-pdf/1187881#1187881sumber
Di ImageMagick, Anda dapat melakukan "supersampling". Anda menentukan kerapatan besar dan kemudian mengubah ukuran sebanyak yang diinginkan untuk ukuran output akhir. Misalnya dengan gambar Anda:
Unduh gambar untuk dilihat pada resolusi penuh untuk perbandingan ..
Saya tidak merekomendasikan menyimpan ke JPG jika Anda mengharapkan untuk melakukan pemrosesan lebih lanjut.
Jika Anda ingin output memiliki ukuran yang sama dengan input, maka ubah ukurannya menjadi kebalikan dari rasio kepadatan Anda menjadi 72. Misalnya, -densitas 288 dan -ukuran 25%. 288 = 4 * 72 dan 25% = 1/4
Semakin besar kepadatan semakin baik kualitas yang dihasilkan, tetapi akan membutuhkan waktu lebih lama untuk diproses.
sumber
Satu saran lagi adalah Anda dapat menggunakan GIMP.
Hanya memuat file PDF di GIMP-> save as .xcf dan kemudian Anda dapat melakukan apa pun yang Anda inginkan pada gambar.
sumber
Saya menggunakan icepdf mesin pdf java open source. Periksa demo kantor .
Saya juga sudah mencoba imagemagick dan pdftoppm , baik pdftoppm dan icepdf memiliki resolusi tinggi daripada imagemagick.
sumber
Harap perhatikan sebelum pemungutan suara, solusi ini untuk Gimp menggunakan antarmuka grafis, dan bukan untuk ImageMagick menggunakan baris perintah, tetapi itu berfungsi dengan baik bagi saya sebagai alternatif, dan itulah sebabnya saya merasa perlu untuk berbagi di sini.
Ikuti langkah-langkah sederhana ini untuk mengekstrak gambar dalam format apa pun dari dokumen PDF
Itu saja.
saya harap ini membantu
sumber
File PNG yang Anda lampirkan terlihat sangat kabur. Jika Anda perlu menggunakan pasca-pemrosesan tambahan untuk setiap gambar yang Anda buat sebagai pratinjau PDF, Anda akan mengurangi kinerja solusi Anda.
2JPEG dapat mengonversi file PDF yang Anda lampirkan ke JPG yang bagus, tajamkan dan potong margin kosong dalam satu panggilan:
sumber
Gunakan baris perintah ini:
Ini harus benar mengkonversi file seperti yang Anda minta.
sumber
Skrip python berikut akan berfungsi pada Mac apa saja (Snow Leopard dan yang lebih tinggi). Ini dapat digunakan pada baris perintah dengan file PDF berturut-turut sebagai argumen, atau Anda dapat dimasukkan ke dalam tindakan Run Shell Script di Automator, dan membuat Layanan (Tindakan Cepat di Mojave).
Anda dapat mengatur resolusi gambar output dalam skrip.
The Script dan Aksi Cepat dapat didownload dari github.
sumber
Anda dapat melakukannya di LibreOffice Draw (yang biasanya diinstal sebelumnya di Ubuntu ):
sumber
Saya telah menggunakan pdf2image . Pustaka python sederhana yang berfungsi seperti pesona.
Pertama instal poppler pada mesin non linux. Anda bisa mengunduh zipnya. Buka zip di File Program dan tambahkan nampan ke Jalur Mesin.
Setelah itu Anda bisa menggunakan pdf2image di kelas python seperti ini:
Saya tidak pandai dengan python tetapi bisa membuatnya exe. Kemudian Anda dapat menggunakan exe dengan input file dan parameter output. Saya telah menggunakannya di C # dan semuanya bekerja dengan baik.
Kualitas gambar bagus. OCR berfungsi dengan baik.
sumber
Ini sebenarnya cukup mudah dilakukan dengan Pratinjau di mac. Yang harus Anda lakukan adalah membuka file di Pratinjau dan simpan sebagai (atau ekspor) png atau jpeg tetapi pastikan Anda menggunakan setidaknya 300 dpi di bagian bawah jendela untuk mendapatkan gambar berkualitas tinggi.
sumber