Apa format arsip paling kuat?

25

Saya ingin mencadangkan beberapa folder lama dengan dokumen yang jarang saya akses. Untuk itu, saya ingin meletakkan semuanya dalam satu arsip. Karena ini akan menjadi cadangan, formatnya harus sesuai dengan tujuan itu. Jadi, intinya:

Manakah format pengarsipan yang paling andal / tangguh di Ubuntu?

Ingo
sumber

Jawaban:

20

Tergantung. Dua opsi yang paling populer adalah tarbal dan file zip, tetapi keduanya kurang:

  • .tar arsip kaset adalah pilihan yang sangat populer bagi sebagian besar pengguna Linux. Ini mempertahankan izin file UNIX (yang penting untuk cadangan) dan tautan keras. Ini didukung out-of-the-box pada setiap distro Linux yang saya uji, serta beberapa program Windows seperti 7-zip . Namun, tar memiliki beberapa keterbatasan dan kekurangan untuk kasus penggunaan cadangan, seperti yang dijelaskan oleh pengembang Duplicity . Ini bisa sangat lambat: bahkan untuk mendapatkan daftar nama file yang disimpan dalam arsip, seluruh arsip harus dibaca. Itu juga tidak menangani meta-data terperinci yang dimiliki oleh beberapa sistem file yang lebih baru.
  • .zip file zip bertindak sebagai arsip dan format kompresi. Untuk kecepatan, Anda dapat menonaktifkan kompresi sepenuhnya. File zip lebih baik daripada arsip tape karena mereka menyimpan jenis daftar isi, memungkinkan program untuk dengan cepat melompat ke file spesifik yang mereka perlu ekstrak. Itu juga menyimpan checksum untuk isi setiap file, untuk memudahkan deteksi korupsi file. File zip sangat populer, sayangnya, mereka tidak cocok untuk Linux back-up karena mereka tidak menyimpan izin file sederhana.

Berikut adalah dua opsi lagi yang, sayangnya, juga kurang:

  • .7z Arsip kompresi 7z memiliki beberapa fitur unggulan seperti enkripsi dan dukungan untuk file yang sangat besar. Sayangnya, itu tidak menyimpan izin file UNIX, sehingga tidak cocok untuk cadangan Linux.
  • .ar arsip UNIX klasik adalah pendahulu arsip arsip, dan menderita keterbatasan yang sama dengan arsip tar.

Menurut pendapat saya, tidak ada format arsip cadangan yang sepenuhnya kuat untuk cadangan Linux, tidak ada yang cukup terkenal untuk menjamin kepercayaan saya, dengan cara apa pun.

Salah satu cara untuk mengatasi keterbatasan masing-masing format ini adalah dengan menggabungkannya: misalnya, arsipkan setiap file satu per satu dalam arsip tar, dan kemudian arsipkan semua tarbal ini dalam satu file zip.

Jika Anda ingin cadangan yang sangat kuat, Anda mungkin harus melihat ke dalam solusi ini sebagai gantinya:

  • Cadangkan langsung ke hard disk eksternal, dengan sistem file yang sama pada sumber dan tujuan. Ini memastikan bahwa Anda akan menyimpan izin dan metadata setiap file persis seperti yang dimaksudkan. (Sebagai tambahan, pemilik dan pemilik grup dari file disimpan menggunakan nomor userid dan groupid mereka, bukan nama mereka.)

  • Gunakan pencitraan disk penuh dan perangkat lunak kloning, seperti CloneZilla . Anda tidak dapat mengambil satu file dari salah satu cadangan ini, tetapi Anda dapat benar-benar yakin bahwa Anda telah menyimpan semua yang Anda bisa.

Dan ingat, selalu ingat: Anda hanya bisa yakin dengan cadangan Anda jika Anda telah berusaha memulihkannya. Jika yang terburuk menjadi terburuk dan hard drive sumber Anda benar-benar hancur, dapatkah Anda mengembalikan semua yang Anda perlukan untuk mengembalikan ke hard drive baru? Apakah ini akan berfungsi seperti yang Anda harapkan? Coba pulihkan cadangan Anda ke cakram keras baru dan coba jalankan dari cakram keras itu selama beberapa hari. Jika Anda melihat ada sesuatu yang hilang, Anda tahu cadangan Anda tidak cukup menyeluruh.

Juga pikirkan di mana Anda menyimpan cadangan Anda. Anda memerlukan setidaknya beberapa cadangan yang tidak berada di gedung yang sama dengan disk sumber untuk melindungi diri Anda dari pencurian atau kebakaran. Beberapa opsi untuk ini adalah cloud, atau rumah teman.

Flimm
sumber
Terima kasih atas penjelasan baik tentang pro dan kontra TAR / ZIP! Sangat berguna.
Pisu
9

Tarball ( .tarfile) akan menjadi cara untuk pergi. Gunakan gzipformat kompresi untuk kompresi lebih sedikit, tetapi kecepatan yang baik. bzip2jauh lebih lambat tetapi memberikan rasio kompresi yang lebih baik. Untuk data biner, tidak ada perbedaan besar.

Perintah untuk mengompresi direktori menggunakan kompresi gzip:

tar czf /path/to/save/backup.tar.gz directory-to-backup

Untuk mengekstrak tarball yang dikompresi gzip sambil mempertahankan izin file:

tar xzpf /path/to/save/backup.tar.gz

Ganti zdengan juntuk kompresi bzip2 dan tambahkan vsebelum v (mis czvfdan xzpvf) untuk mencetak nama file saat diarsipkan / diekstraksi.

Lekensteyn
sumber
4
Untuk keandalan, Anda tidak menginginkan kompresi. Kerusakan pada arsip terkompresi akan menyebabkan semua yang mengikuti titik kerusakan hilang.
psusi
5
@psusi Itu tidak benar untuk bzip2, yang dikompres dalam ~ 1MB potongan. Lihatlah bzip2recover.
phihag
@ Phihag, rapi, setelah bertahun-tahun aku tidak menyadarinya! +1. Alasan yang sangat bagus untuk bzip2 dibandingkan gzip.
psusi
7

Saya memilih 7zip ( sudo apt-get install p7zip-full). Sepertinya pengarsipan kompresi yang ideal dari sudut pandang saya.

Saya tidak suka tarbal klasik karena kecanggungannya karena seluruh file tar harus didekompresi (yang mungkin terjadi di belakang layar, tetapi masih terjadi) hanya untuk melihat daftar isi arsip.

Ivan
sumber
4

Meskipun tidak terlalu dikenal atau digunakan secara luas, saya cenderung menggunakan afio karena cara kompres file secara individual sehingga memungkinkan pemulihan jika terjadi korupsi. Instal melalui aptitude atau serupa.

nat
sumber
1

Tarball Gzipped (.tar.gz, .tgz), standar pengarsipan Linux. Anda tidak bisa salah dengan itu.

Tidak pernah dalam hidupku aku memiliki arsip .tar.gz yang rusak atau bahkan menyusahkan. Di FlatmateRooms kami menggunakan ini untuk mengarsipkan ratusan ribu gambar di server dan semua cadangan.

Flatmate
sumber
0

Dalam beberapa kasus ini berguna bagi saya.

tar -cJvf paquete.tar.lzma folder-to-backup/
maniat1k
sumber