Duplicity Full Backup Seumur Hidup dan Efisiensi

17

Saya mencoba menyusun strategi cadangan untuk beberapa klien, dan condong ke arah duplikasi untuk cadangan jarak jauh (sudah menggunakan rdiff-cadangan untuk cadangan internal / di lokasi).

Apakah masuk akal untuk menginginkan cadangan penuh begitu sering? Karena peningkatan duplikat maju, setiap cadangan tambahan bergantung pada kenaikan sebelumnya, dan semua sangat bergantung pada cadangan penuh terakhir. Jika itu menjadi korup, hal-hal buruk terjadi. Pertanyaan terkait: Apakah Duplicity menguji cadangan inkremental untuk konsistensi?

Dengan asumsi saya memang menginginkan cadangan penuh sesering mungkin, seberapa efisien duplikat membuat cadangan lengkap itu? Bisakah / apakah itu memeriksa tanda tangan file dan menyalin data yang tidak berubah dari backup / peningkatan penuh sebelumnya? Pada dasarnya membuat arsip 'lengkap' baru mentransfer data baru / diubah dan menggabungkan data yang tidak berubah yang ada?

Saat ini kekhawatiran saya adalah bahwa menjalankan pencadangan penuh diperlukan, tetapi penggunaan bandwidth yang besar dan konsisten dari pencadangan penuh akan membuat ini tidak masuk akal untuk beberapa klien.

Tim Lytle
sumber

Jawaban:

8

Saya pikir masuk akal untuk menginginkan cadangan penuh sesering mungkin: sebagian besar mesin saya dikonfigurasikan untuk melakukannya setiap beberapa bulan. Tidak ada yang ajaib tentang angka itu: nilai yang tepat akan tergantung pada berapa banyak data yang Anda miliki, seberapa cepat itu berubah, seberapa besar kemungkinan Anda ingin memulihkan dari apa pun selain snapshot terbaru, berapa banyak lalu lintas dan biaya penyimpanan Anda , dan seberapa paranoid Anda. Orang lain mungkin menginginkan cadangan penuh setiap minggu.

Kecuali jika Anda melakukan pencadangan penuh dari waktu ke waktu ukuran arsip dan waktu pemulihan akan terus bertambah.

Saya tidak berpikir bermuka dua secara khusus memiliki "centang" perintah http://pad.lv/660895 , tetapi akan lebih baik jika itu terjadi. Sangat bijaksana untuk melakukan tes pengembalian setiap begitu sering.

Pertanyaan terkait adalah apakah Anda harus menyimpan lebih dari satu rantai cadangan. Sekali lagi, itu tergantung pada biaya. Salah satu alasan untuk mempertahankannya adalah bahwa Anda dapat memulihkannya jika rantai saat ini rusak, baik karena kegagalan perangkat keras, kegagalan OS, atau bug duplikat. Tentu saja jika rantai lama sudah sangat tua, memulihkannya mungkin memiliki nilai terbatas.

Membuat cadangan lengkap selalu mengunggah salinan lengkap data.

Jika masalah klien adalah fraksi dari bandwidth yang digunakan, bukan biaya lalu lintas, Anda mungkin ingin menjalankannya di bawah misalnya trickle.

Poolie
sumber
2
Duplicity sekarang memiliki perintah "verifikasi": help.ubuntu.com/community/DuplicityBackupHowto#Verify
Eli
5

Apa yang Anda minta disebut cadangan penuh sintetis , yang mengacu pada proses mendapatkan cadangan penuh dengan menggabungkan cadangan tambahan dengan cadangan penuh sebelumnya di sisi tujuan (yaitu: server cadangan).

Saya tidak terbiasa dengan Duplicity, tetapi dari situs web mereka tampaknya tidak melakukan backup penuh sintetis. Anda harus menyimpan semua inkremental kembali ke penuh yang menjadi basisnya. Jika itu adalah kasus, Anda mungkin akan ingin memaksa full backup setiap begitu sering, karena:

  • Melewati sejuta tambahan mungkin akan membuat pemulihan menjadi lambat
  • Anda mungkin tidak ingin menjaga inkremental kembali ke awal waktu

Salah satu cara menarik untuk mencapai sintetis penuh adalah dengan menggunakan rsync dengan opsi --link-dest = DIR , atau menggunakan rsnapshot . Ini hanya akan menyimpan perbedaan antara setiap cadangan inkremental, tetapi masing-masing akan tampak penuh. Ketika Anda menghapus salah satu dari mereka, itu akan secara otomatis menggabungkan tambahan secara tepat. Ini dilakukan melalui keajaiban tautan keras, sehingga diffs akan berbasis file (baik file telah berubah dan termasuk dalam diff, atau tidak).

lukecyca
sumber
Ini membuat saya dengan satu pertanyaan, bagaimana saya bisa menggunakan duplikat untuk enkripsi tetapi masih memiliki cadangan sintetis. Tampaknya bermuka dua memang memiliki kompatibilitas rsync tapi iet sulit mencari tahu .. @poolie
user1226868