Program kompresi file yang lebih efisien untuk banyak file yang identik?

12

Saya sedang melakukan backup pekerjaan saya dan saya sedang mencari program yang dapat secara lebih efisien mengkompres file. Program kompresi standar windows berfungsi dengan baik, tetapi tidak berfungsi sebagai "pintar" seperti yang saya inginkan.

File-file saya pada dasarnya seluruh snapshot dari pekerjaan saya yang diambil selama beberapa bulan terakhir saat saya melakukan backup lengkap biasa. tidak banyak perubahan antara backup dan banyak file hanya salinan satu sama lain.

Seluruh set file saya sekitar 15GB tidak terkompresi, sementara cadangan snapshot individu (dikompres menggunakan program kompresi standar) masing-masing sekitar 150 hingga 200 MB (biasanya ukurannya bertambah dengan tanggal yang lebih baru). Ukuran total semua foto yang dikompresi adalah sekitar 3GB. Karena sifat dari file, saya berharap program kompresi "pintar" untuk mengambil seluruh volume turun menjadi sekitar 400-500 MB, yaitu dengan mempertimbangkan inefisiensi yang masuk akal dan ruang ekstra untuk mengompresi perbedaan dalam file.

Apakah ada program kompresi yang akan mengambil keuntungan dari kenyataan bahwa banyak file identik untuk mencapai rasio kompresi yang jauh lebih tinggi daripada program kompresi windows standar?

Terimakasih

Sunting: Baru saja menyelesaikan kompresi terbaik dari seluruh volume menggunakan kompresi windows standar. Ini hanya 10MB lebih baik dari gabungan snapshot terkompresi. Menurut pendapat saya itu tidak dapat diterima mengetahui sifat dari file.

ChrisF
sumber
Pada versi windows apa?
John T
1
Heh, vista-nya ...
3
Tidakkah beralih ke kontrol versi alih-alih cadangan itu lebih baik? Saya menggunakan git juga untuk file biner dan berfungsi dengan sangat baik. Saya tidak berpikir itu bisa mengkompres sebaik 7z, tetapi apakah itu penting jika dibutuhkan 150 MB atau 300 MB? Jika tidak, saya akan gunakan untuk kemudahan penggunaan dan fleksibilitas.
maaartinus

Jawaban:

18

7-zip mendukung kompresi yang solid jika saya ingat dengan benar, sehingga harus memampatkan banyak file yang hampir identik dengan sangat baik.

T. Kaltnekar
sumber
2
+1, dan pertimbangkan format 7z default .
nik
Saya akan mencobanya, saya akan kembali kepada Anda dengan hasilnya.
2
Setelah 1 jam kompresi pada pengaturan tertinggi saya mendapatkan ukuran file 133MB. Ini sangat mengesankan! Perkiraan agresif asli saya (yang tidak saya sebutkan) adalah ukuran file sekitar 150MB (ini bertentangan dengan perkiraan konservatif saya yang dinyatakan 400-500MB). Sepertinya saya akan mengonversi ke 7z mulai sekarang!
Bahkan jika Anda harus tetap menggunakan format Zip standar, 7-zip memiliki hasil yang lebih baik daripada alat kompresi populer lainnya (WinRAR, WinZip) dengan pengaturan efisiensi tertinggi.
christophem
7 zip secara harfiah adalah salah satu alat pertama yang saya pasang di kotak baru. Itu terlalu berguna.
corsiKa
6

Saya melakukan beberapa pengujian pada aspek "file identik", sebagaimana disebutkan dalam pertanyaan, menggunakan 7-zip (versi 9.20), karena belum ada yang memberikan jawaban yang rumit tentang itu, belum. Ini memberikan beberapa hasil menarik. Saya menguji dengan 10 salinan file yang digunakan situs ini untuk pesannya yang tidak ditemukan halaman . File ini tidak akan kompres dengan baik sebagai file individual, menjadi file jpg. Jadi, ini akan menunjukkan efisiensi mengompresi banyak file yang identik. Ukuran file-nya adalah 37 KB.

  1. Ketika saya kompres semua sepuluh salinan, gunakan untuk format zip, ukuran file adalah 367 KB, dengan ukuran terkompresi sekitar 99% dari ukuran total asli dari semua 10 file.
  2. Ketika saya mengompres semua sepuluh salinan, menggunakan format 7z, ukuran file adalah 37 KB, dengan ukuran terkompresi sekitar 101% dari hanya satu dari file asli.
  3. Jika saya pertama kali menempatkan 5 salinan dalam arsip 7-z, kemudian menambahkan 3 dan akhirnya 2 salinan dalam langkah-langkah terpisah, ukuran file menjadi 111 KB, sekitar tiga kali ukuran dari satu file asli.

Jika saya membuka arsip ke-3, salah satu propertinya adalah Blok . Ini daftar 0, 1 dan 2 untuk 3, 5 dan 2 file, masing-masing.

Pengamatan:

  1. Format zip akan mengkompres setiap file secara terpisah, tidak mendapat manfaat dari kemungkinan untuk mengompres file yang identik secara efisien.
  2. Format 7z akan secara efisien mengkompres banyak file yang identik, asalkan ditambahkan ke arsip dalam satu langkah.

Kesimpulan:

  1. Untuk kompresi file yang optimal, gunakan 7z daripada zip.
  2. Kompresi dapat meningkat secara dramatis, jika Anda tidak menambahkan file ke arsip 7z yang ada, tetapi dekompres terlebih dahulu dan kompres lagi, termasuk file baru, dalam satu langkah.
R. Schreurs
sumber
1

Windows Vista dilengkapi dengan Backup and Restore Center . Ini akan melakukan backup file Anda secara bertahap untuk menghindari pemborosan ruang dan harus membuat banyak backup. Dari halaman tertaut:

Versi file yang dicadangkan sebelumnya hanya menggunakan ruang disk minimum. Jika hanya sebagian kecil file berubah (seperti satu slide dalam presentasi), hanya bagian itu yang dilacak dan disimpan.

John T
sumber
1

7-zip memiliki salah satu algoritma kompresi terbaik. Saya tidak percaya saat ini ada sesuatu yang mengalahkan 7-zip dalam kompresi (algoritma) sejauh ini.

Beruang yang pemarah
sumber