Bagaimana "Ukuran Word" memengaruhi kompresi?

24

Di 7 Zip saat menambahkan folder ke arsip ada opsi untuk mengubah Ukuran Word.

Bagaimana ukuran kata ini memengaruhi kompresi, khususnya ukuran akhir zip?

Saya perhatikan bahwa mengubah tingkat kompresi meningkatkan ukuran kata, namun bahkan pada ultra itu hanya memilih ukuran kata 128 meskipun opsi terbesar adalah lebih dari dua kali lipat. Apakah ada alasan mengapa ultra tidak memilih yang terbesar? Apakah ukuran kompresi optimal di suatu tempat antara ukuran kata terbesar dan terkecil?

Aequitas
sumber
Lihatlah apa yang dikatakan Shell di posting ini tentang bagian dari pertanyaan Anda di sini -> The Post .
Pimp Juice IT
@LMFAO_A_JOKE yang hanya mengatakan untuk beberapa file lebih tinggi lebih baik kadang-kadang tidak
Aequitas
1
Ini tidak MENJAWAB semua pertanyaan Anda dengan sangat terperinci tetapi untuk SATU pertanyaan tentang -> How does this word size affect compression, in particular the final size of the zip?Saya pikir bagian posting yang menyatakan WordSize: usually the bigger, the better (and slower) for well-compressible data (such as documents). Archive size depends quite non-monotonically of it.memberi Anda penjelasan kepada BAGIAN dari set pertanyaan Anda. Inilah sebabnya saya hanya menaruh ini di sini untuk komentar dan TIDAK menjawab - hanya mencoba memberi Anda sesuatu !!!
Pimp Juice IT
Apa arti kalimat terakhir, Ukuran arsip ... tidak monoton
Aequitas
1
Saya pikir ini berarti bahwa ukuran arsip akan lebih kecil (mengurangi ukuran dari ukuran aslinya lebih) "biasanya" dengan semakin besar nilai WordSize, tetapi "tergantung" pada kompresibilitas tipe data yang sedang dikompres seperti teks sebagai lawan dari file gambar mungkin sebagai salah satu contoh. Sarannya adalah untuk menguji nilai yang berbeda untuk mendapatkan nilai yang paling optimal untuk data Anda meskipun untuk mengetahui Anda memilih opsi terbaik yang sesuai dengan kebutuhan Anda.
Pimp Juice IT

Jawaban:

8

Ini sangat tergantung pada data yang Anda kompres dan algoritma yang digunakan.

Ukuran kata

Masukkan panjang kata-kata, yang akan digunakan untuk menemukan urutan byte yang identik untuk kompresi. Untuk LZMA, ukuran kata besar biasanya memberikan rasio kompresi sedikit lebih baik dan proses kompresi lebih lambat. Parameter ukuran kata besar dapat secara signifikan meningkatkan rasio kompresi jika file berisi urutan byte identik yang panjang. Untuk ukuran kata PPMd memiliki arti besar. Ini sangat mempengaruhi rasio kompresi dan kecepatan kompresi / dekompresi.

Ada beberapa perbandingan di sini

Hefewe1zen
sumber