Pengaturan apa yang digunakan saat membuat file 7zip untuk mendapatkan kompresi maksimum saat mengompresi PDF?

15

Pengaturan apa yang digunakan saat membuat file 7zip untuk mendapatkan kompresi maksimum? Saya mengompresi dokumen PDF yang berisi gambar yang dipindai. Saya sedang berpikir tentang menggunakan LZMA2, tetapi saya tidak tahu apa yang harus diatur dalam ukuran kamus, ukuran kata, dll. Juga, apakah LZMA atau PPMd menjadi pilihan yang lebih baik?

Saya perlu mentransfer beberapa file (~ 200MiB) melalui internet dan kecepatan unggah di sini sangat lambat, jadi saya ingin mengompres data sebanyak mungkin. Waktu yang dihabiskan CPU tidak terlalu penting.

EDIT

Inilah yang saya dapatkan setelah menguji berbagai metode kompresi:

Ukuran tidak terkompresi adalah: 25.462.686 M

Prosesor saya adalah Intel Core 2 Due T8100 dan saya memiliki 4GiB of ram.

Kompresi terbaik adalah dengan PeaZip menggunakan algoritma PAQ8O. Ukuran file yang dihasilkan adalah 19.994.325B. Pengaturan yang digunakan adalah tingkat kompresi: maksimum. Sayangnya, kecepatan kompresi sekitar 5KiB / s, jadi butuh lebih dari satu jam untuk mengompres data.

Berikutnya adalah kompresor PAQ9O eksperimental. Dengan menggunakannya, saya mendapatkan 20.132.660B dalam waktu sekitar 3 menit kompresi. Sayangnya, program hanya baris perintah, dan tidak banyak program lain yang menggunakan algoritma kompresi itu. Ini juga menggunakan sekitar 1.5GiB RAM dengan pengaturan yang saya gunakan (a -9 -c)

Setelah itu 7-Zip 9,15 beta (2010-06-20) menggunakan LZMA2. Dengan menggunakannya, saya mendapat 20.518.802B dalam waktu sekitar 3 menit. Pengaturan yang digunakan adalah ukuran kata 273, ukuran kamus 64MB dan saya menggunakan 2 utas untuk kompresi.

Sekarang kembali ke pertanyaan awal saya: Dalam kasus saya ukuran blok padat tidak menghasilkan hasil yang nyata. Menambah ukuran kata memang membuahkan beberapa hasil. Perbedaan antara ukuran kata tertinggi dan terkecil adalah 115.260B. Saya percaya bahwa penghematan semacam itu membenarkan upaya yang diperlukan untuk membuat dua klik yang diperlukan dan mengubah ukuran kata.

Saya mencoba menggunakan algoritma kompresi lain yang didukung oleh 7zip dan PeaZip dan mereka menghasilkan file dalam ukuran dari 19.8MiB hingga 21.5MiB.

Pada akhirnya kesimpulan saya adalah bahwa ketika mengompresi dokumen PDF yang berisi sebagian besar gambar, upaya yang diperlukan untuk menggunakan algoritma kompresi eksotis tidak dibenarkan. Kompresi menggunakan LZMA2 di 7zip menghasilkan hasil yang cukup dapat diterima dalam jumlah waktu paling sedikit.

AndrejaKo
sumber
Apa perbedaan menggunakan PeaZip? Ini hanya pembungkus GUI sekitar 7zip dan banyak alat lainnya
Cole Johnson
@Cole "Cole9" Johnson Yah perbedaannya adalah bahwa dalam kasus saya, saya menggunakan beberapa alat "lainnya" dari PeaZip yang tidak memiliki GUI pada saat itu. Jika saya ingat dengan benar saat itu maka hanya PeaZip yang menawarkan algoritma PAQ8O dengan GUI.
AndrejaKo

Jawaban:

7

Konten PDF (teks & gambar) mungkin sudah dikompres - jadi tidak akan ada banyak untungnya dengan mencoba mengompresnya lagi.

lebih gila
sumber
3
Ya tidak. Saya melakukan sedikit pengujian dan mengambil 24MiB PDF dan mengompresnya menggunakan pengaturan default. Hasilnya adalah file 19 MiB. Dalam kasus saya, 5 MIB itu penting dalam kasus saya.
AndrejaKo
1
Sepertinya kamu benar. Saya tidak dapat menghasilkan hasil yang jauh lebih baik daripada default 7zip apa pun yang saya lakukan. Saya masih yakin bahwa beberapa kompresi lebih baik daripada tidak sama sekali.
AndrejaKo
3
Jika Anda bisa menghemat banyak ruang, maka mungkin ada pekerjaan yang dapat dilakukan dengan PDF sendiri untuk menghemat hampir semua ruang itu tanpa 7-Zip. Perjalanan melalui Pengoptimal Acrobat PDF dapat menghasilkan keajaiban.
Afrazier
Lihat jawaban usr - kompresi yang digunakan dalam PDF (zlib) dapat dikembalikan untuk mengompresnya lebih lanjut (dan diterapkan kembali pada rekonstruksi). Ini sering menghasilkan pengurangan ukuran ~ 50%
schnaader
@ schnaader: Itu sangat menarik. Saya telah melihat dan menggunakan alat-alat seperti PDF Optimizer dan MuPDF dari Acrobat untuk memodifikasi PDF sambil tetap dapat dilihat, tetapi mampu mengubah mereka seperti itu juga sangat berharga dan dapat digunakan untuk keuntungan besar.
Afrazier
8

Coba precomp - pertama kali mendekompres data yang sudah terkompresi di dalam PDF Anda. Kemudian 7z dapat melakukan keajaiban pada data yang tidak terkompresi.

Coba juga nanozip yang saya verifikasi sangat efektif, namun sangat efisien (400 kb / s pada rasio kompresi algoritma PAQ).

usr
sumber
2

7za a -t7z -mx-9 -mfb = 258 -mpass = 15 nama file.7z subdir

Sesuaikan kata pertama seperlunya untuk nama baris perintah Anda yang dapat dieksekusi, dan sesuaikan bagian setelah "-mpass = 15" untuk menyesuaikan nama file Anda dan apa yang harus dimasukkan.

Jawaban ini tidak spesifik untuk dokumen PDF.
Ini menggunakan LZMA, bukan PPM. Saya menjauh dari PPM karena ada terlalu banyak variasi yang tidak kompatibel dengan variasi lain. LZMA terlihat lebih stabil, dengan kompatibilitas yang lebih banyak didukung. Jadi saya menjauh dari PPM karena pendapat saya, seperti yang telah Anda nyatakan, "upaya yang diperlukan untuk menggunakan algoritma kompresi eksotis tidak dibenarkan."

TOOGAM
sumber
2
LZMA2 secara signifikan lebih baik daripada LZMA tetapi untuk (efektif) hanya digunakan pada sistem 64 bit.
OMY
-3

Kompresi lzma adalah yang terbaik karena Anda dapat membuat file sfx atau paket msi dengan rasio kompresi yang tinggi. dalam kasus Anda, Anda tidak mengompresi file besar sehingga perbedaannya cukup kecil terutama jika file tersebut telah dikompresi seperti: mp3 atau png

coba win arc itu gratis dan memberikan rasio kompresi yang bagus

nader
sumber