Saya memiliki file PDF 72,9MB yang harus saya kurangi menjadi di bawah 500KB.
File tersebut adalah gambar JPEG yang telah saya pindai, dan kemudian dikonversi ke pdf.
pdf
compression
tamimym
sumber
sumber
pdfopt
memiliki sintaksis sederhana dan meningkatkan kecepatan pemuatan dan pergantian halaman di era iPad. :-)Jawaban:
aking1012 benar. Dengan informasi lebih lanjut tentang kemungkinan gambar yang disematkan, hyperlink dll. Akan jauh lebih mudah untuk menjawab pertanyaan ini!
Berikut adalah beberapa solusi skrip dan baris perintah. Gunakan sesuai keinginan Anda.
sumber
Gunakan perintah ghostscript berikut :
-dPDFSETTINGS=/screen
kualitas lebih rendah, ukuran lebih kecil. ( 72 dpi )-dPDFSETTINGS=/ebook
untuk kualitas yang lebih baik, tetapi pdf yang sedikit lebih besar. ( 150 dpi )-dPDFSETTINGS=/prepress
output mirip dengan pengaturan Acrobat Distiller "Prepress Optimized" ( 300 dpi )-dPDFSETTINGS=/printer
memilih output yang mirip dengan pengaturan Acrobat Distiller "Print Optimized" ( 300 dpi )-dPDFSETTINGS=/default
memilih output yang dimaksudkan untuk berguna di berbagai penggunaan, mungkin dengan mengorbankan file output yang lebih besarsumber
screen
pengaturannya terlalu rendah untuk saya, tetapiebook
bekerja dengan baik, memotong PDF berbasis pemindaian 33Mb menjadi 3,6Mb, dan menjaganya tetap mudah dibaca. Opsi lain untuk-dPDFSETTINGS
opsi ini tercantum di sini: milan.kupcevic.net/ghostscript-ps-pdf , dan mungkin ide yang baik untuk memasukkannya dalam jawaban ini.Cara favorit saya untuk melakukan ini adalah dengan mengkonversi pdf ke ps dan kembali. Meskipun demikian, ini tidak selalu berhasil, tetapi ketika berfungsi hasilnya bagus:
Ini juga langsung bekerja di pdf, seperti yang disarankan dalam komentar.
Beberapa pengguna juga melaporkan lebih banyak kesuksesan ketika menggunakan pengaturan ebook sebagai berikut:
sumber
ps2pdf intput.pdf output.pdf
Jika Anda memiliki pdf dengan gambar yang dipindai , Anda dapat menggunakan
convert
untuk membuat pdf dengan kompresi jpeg (Anda dapat menggunakan metode ini pada pdf apa pun, tetapi Anda akan kehilangan semua informasi teks).Sebagai contoh:
Sesuaikan kepadatan (mis. 100x100) dan kualitas sesuai kebutuhan Anda.
Tergantung pada input kompresi jpeg Anda mungkin bukan pilihan terbaik karena artefak kompresi. Anda memiliki pilihan antara BZip, Faks, Group4, JPEG, JPEG2000, Lossless, LZW, RLE atau Zip sebagai metode kompresi alternatif (beberapa hanya memperbolehkan gambar b / w). Untuk detailnya lihat di sini .
Saya dapat mencapai rasio kompresi yang hebat untuk dokumen yang dipindai / difoto (tergantung pada pengaturannya). Tergantung pada sumber dokumen, Anda mungkin ingin mengurangi kedalaman warna (
-depth
argumen).sumber
pdfimages input.pdf pages
untuk mengekstrak file pbm, maka Anda dapat melakukan sesuatu seperti:for page in *.pbm; do convert $page -compress Group4 -type bilevel TIFF:- | convert - output.pdf
. Setiap OCR akan hilang, jadi saya biasanya melakukannyapdfsandwich output.pdf
, yang tampaknya mengurangi ukuran file lebih jauh.gs
belakang layar.--density --quality --compress
vs-density -quality -compress
.-resize 50%
juga, ubah persentase tergantung pada berapa banyak DPI digunakan saat pemindaianSaya perlu berhemat PDF yang berisi pemindaian dokumen berwarna. Setiap halaman saya adalah gambar penuh warna sejauh menyangkut file. Itu adalah gambar dari halaman yang mengandung teks dan gambar, tetapi itu dibuat dengan memindai ke suatu gambar.
Saya menggunakan kombinasi perintah ghostscript di bawah ini dan satu dari utas lainnya.
Ini mengurangi resolusi gambar menjadi 150dpi, memotong ukuran file saya menjadi dua. Melihat dokumen itu, hampir tidak ada kehilangan kualitas gambar yang nyata. Teks masih dapat dibaca dengan sempurna pada Nexus7 2012 saya.
sumber
Berikut ini adalah skrip untuk menulis ulang pdf yang dipindai:
Anda dapat menyesuaikan sedikit agar lebih dapat digunakan kembali tetapi jika Anda hanya memiliki satu pdf, Anda bisa menggantinya
$1
dengan nama file pdf Anda dan memasukkannya ke terminal.sumber
Saya biasanya menggunakan ps2pdf untuk melakukan ini (sintaksis lebih mudah), sesuatu seperti ini:
Saya menggunakan skrip python berikut untuk mengurangi ukuran semua file pdf dalam direktori di server produksi (8.04). Jadi harusnya berhasil.
sumber
Ini akan memiliki hasil yang bagus.
sumber
Yang terbaik bagi saya adalah
Cara lain:
salam
sumber
pdf2ps input.pdf temp.ps && ps2pdf14 temp.ps output.pdf && rm temp.ps
Saya sendiri mengalami masalah ini. Jika menggunakan pemindaian sederhana, pilih mode teks untuk pemindaian resolusi rendah dan Anda tidak perlu khawatir tentang hal-hal baris perintah. Hanya mengatakan.
sumber
Kontrol kualitas kompresi:
sumber
shift
. Parameter pertama adalah file input, kedua adalah file output dan sisanya dari parameter akan diteruskan kegs
apa adanya.Karena tautan ini pertama kali bagi saya ketika saya mencari di Google, saya pikir saya akan menambahkan satu kemungkinan lagi. Tidak ada solusi di atas yang berfungsi untuk saya pada pdf yang diekspor dari Inkscape (15 mb), tetapi saya akhirnya dapat mengecilkannya menjadi 1 mb dengan membukanya di GIMP, dan mengekspor sebagai pdf lagi.
Opsi lain yang mendekati (tetapi teks sedikit kabur) adalah utilitas konversi ImageMagick:
sumber
convert -compress Zip
tampaknya meraster semua vektor.Pada akhirnya saya menulis skrip bash saya sendiri untuk menyelesaikan ini, ia menggunakan
mogrify
,convert
dangs
untuk mengekstrak halaman pdf sebagai png, mengubah ukurannya, mengubahnya menjadi 1-bit bmp dan kemudian membangunnya kembali sebagai pdf. Pengurangan ukuran file bisa lebih dari 90%. Tersedia di http://www.timedicer.co.uk/programs/help/pdf-compress.sh.php .sumber
Saya sangat merekomendasikan pdfsizeopt .
Hal ini jauh lebih efisien dalam hal pengurangan ukuran daripada sebelumnya CLI dan GUI perangkat lunak yang saya telah mencoba (termasuk
convert
,gs
,pdftk
, dll) - meskipun mungkin lebih lambat denganpngout
diaktifkan -, dan tidak memiliki beberapa masalah mereka (tidak ada berat gambar pixelated / terdegradasi, tidak ada kehilangan bookmark, dll.).Sekarang, jika Anda perlu mencapai ukuran tertentu apa pun konsekuensinya (termasuk merendahkan gambar ke titik tidak dapat dibaca), itu mungkin bukan alat yang Anda butuhkan, tetapi sebagai solusi yang selalu berfungsi, untuk mengurangi ukuran besar yang tidak perlu dalam PDF tanpa kehilangan keterbacaan, informasi dan kualitas gambar yang dapat diterima, saya pikir itu adalah pilihan terbaik. (Catatan: Saya cenderung menggunakannya setelah pertama kali melakukan vektorisasi-OCR di Adobe Acrobat [fungsi yang dulu disebut "CleanScan"], yang dapat memiliki dampak ukuran yang dramatis pada beberapa dokumen teks yang dipindai.)
Saya merekomendasikan instalasi Unix generik :
Instal semua dependensi yang diperlukan:
Unduh dan instal yang dapat dieksekusi:
Pemakaian:
Catatan untuk pengguna mac yang menemukan entri ini (atau pengguna Linuxbrew): ada rumus pemasangan Homebrew:
sumber
Saya menghadapi masalah yang sama, dan senang menemukan utas ini. Secara khusus saya memiliki pdf yang dihasilkan dari gambar yang dipindai, dan perlu mengurangi ukuran byte-nya dengan faktor 6.
Sayangnya, tidak ada solusi di atas yang bekerja :(. Kemudian saya menyadari bahwa di suatu tempat di pemindai-> proses jpeg-> pdf ukuran halaman telah membengkak oleh faktor aprx 4. Dokumen yang saya pindai semuanya berukuran Letter, tetapi pdf memiliki ukuran
Saya mendapatkan hasil yang diinginkan akhirnya dengan perintah "convert" yang melakukan perubahan ukuran sekaligus langkah kompresi dalam satu:
Perhatikan bahwa doc_orig memiliki kerapatan 72x72 dpi.
sumber
Jika mengonversi ke djvu juga akan baik-baik saja dan jika tidak ada warna yang terlibat, Anda dapat mencoba yang berikut ini:
Konversikan pdf ke file jpg menggunakan
pdfimages -j
Jika Anda mendapatkan file pbm sebagai gantinya, Anda harus melakukan langkah menengah:
for FILENAME in $(ls *.pbm); do convert $FILENAME ${FILENAME%.*}.jpg ;done
Perintah convert adalah dari paket imagemagick.
Kemudian gunakan scantailor untuk membuat tif keluar darinya.
Pada langkah terakhir Anda pergi ke scantailors keluar direcory (di mana tif's berada) dan menerapkan djvubind ke direktori itu.
Ini harus mengurangi ukuran file secara drastis tanpa kehilangan kualitas teks yang besar. Jika Anda ingin kontrol yang lebih baik atas ocr-backend, Anda dapat mencoba
djvubind --no-ocr
dan menggunakan ocrodjvu untuk menambahkan lapisan ocr sesudahnya.Jika Anda memiliki warna pada dokumen Anda, hal-hal menjadi sedikit lebih rumit. Alih-alih djvubind Anda bisa menggunakan didjvu dan di scantailor Anda harus mengubah ke mode campuran dan kadang-kadang memilih gambar warna secara manual.
sumber
memuat gambar atau bahkan file pdf ke inkscape.
Dari inkscape: Simpan dalam format vektor (sebagai asli .svg).
Impor file vektor ke dalam scribus, edit layout, dan ekspor / simpan sebagai .pdf dari sana
sumber
Alat kompres PDF super sederhana: halaman GitHub.
Instalasi di Ubuntu:
Ini menggunakan ghostscript.
sumber
Anda dapat mencoba ini:
Ini lebih cepat daripada
gs
tetapi kompres hingga 30% dalam hal ini untuk file input 107,5MiB.sumber
Bagi saya
screen
opsi gs terlalu buruk, dan yangebook
terlalu besar.Dokumen asli saya berisi teks sebagai gambar berwarna dan hitam putih (tergantung halaman).
Solusi terbaik yang saya lakukan adalah:
Perhatikan bahwa tingkat kompresi tidak linier .. jika saya menentukan 135 itu tidak dikompresi, saya menemukan 130 menjadi (dalam kasus saya) resolusi maksimum yang mencapai kompresi.
sumber
Saya menggunakan perintah di bawah ini tetapi tidak memampatkan file pdf saya secara substansial. Beberapa kali beberapa bagian dihitamkan setelah kompresi.
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -sOutputFile=output.pdf $INPUTFILE
"ps2pdf -dPDFSETTINGS=/ebook %s %s" % (input_file_path, out_file_path)
Setelah terlalu banyak berkeliaran di web saya tidak bisa menemukan perpustakaan kompresi yang tepat. Saya menemukan
pdfcompressor.com
. Ini hanya situs web yang luar biasa. Ini kompres pdf sebesar 95% (15Mb file). Jadi saya menggunakan selenium dan Tor untuk mengotomatiskan kompresi. Periksa Github Repository saya. [GITHUB] ( https://github.com/gugli28/PdfCompressor )sumber