Apa itu "deduplikasi"?

8

Maksud saya, saya dapat melihat definisi kamus, tetapi mengapa semua orang tiba-tiba membicarakannya sehubungan dengan perpustakaan tape virtual? Apa yang "baru" di sini sehingga akhir-akhir ini begitu banyak berita?

lavinio
sumber

Jawaban:

14

Deduplikasi adalah tempat Anda melihat konten kumpulan data, catat semua bit duplikat yang ada, dan simpan data hanya sekali, ganti semua salinan data dengan pointer kembali ke satu salinan. Ini sangat membantu dengan cadangan karena ketika Anda membuat cadangan hal-hal seperti server begitu banyak data yang sama. Bayangkan, misalnya, Anda mencadangkan 1.000 server Windows - banyak konten di kotak itu akan identik.

Deduplikasi sangat populer hari ini dengan 3 alasan:

  1. Akhir-akhir ini semua orang terobsesi untuk membangun solusi pemulihan bencana yang menggunakan server di luar lokasi. Untuk melakukan ini, Anda harus mereplikasi banyak data produksi ke situs jarak jauh dan bandwidth adalah masalah besar. Setiap pengurangan jumlah data yang harus Anda tiru sangat membantu.

  2. Jumlah data yang disimpan oleh perusahaan sedang meledak - berkat penyimpanan yang lebih murah dan persyaratan multi-industri untuk penyimpanan catatan.

  3. Teknologi ini relatif baru-baru ini menyentuh sweet spot. Kami telah memiliki hal-hal seperti deduplikasi untuk waktu yang lama (penyimpanan satu contoh, dll) yang telah membantu tetapi hanya dalam setahun terakhir kami telah melihat deduplikasi nyata yang dapat secara signifikan mengurangi jumlah penyimpanan yang masuk ke arus utama.

icky3000
sumber
2
Saya juga akan menambahkan bahwa biaya solusi de-dup menurun sehingga vendor memiliki pekerjaan yang lebih mudah menjual manfaatnya - dan jika lebih mudah untuk menjual, vendor akan membicarakannya lebih lanjut ... Saya belum melihat diskusi khusus membahas tape virtual perpustakaan lebih dari metode cadangan lain, tapi saya kira ini adalah kesempatan untuk memasarkan manfaat dari keduanya bersama-sama.
William
1
@ William: Ya, tepatnya, saya agak bermaksud merujuk ke bagian biaya ketika saya mengatakan "sweet spot" tetapi tidak menjelaskannya jadi terima kasih untuk menunjukkannya. Tentu saja biayanya menjadi cukup rendah sehingga banyak dari kita dapat menemukan solusi dedupe yang benar-benar mampu kita bayar.
icky3000
0

Salah satu hal yang kami temukan di perusahaan saya dalam bekerja dengan Netapp adalah bahwa deduplikasi benar-benar hanya berfungsi dengan baik di lingkungan VM jika drive Anda disejajarkan. Yang merupakan masalah bagi kami karena kami memiliki banyak mesin Windows Server 2003 dan tidak ada drive yang selaras. Yang berarti Anda hampir tidak dapat memulihkan sekitar seperempat ruang yang mungkin jika drive disejajarkan dengan benar.

Kami diberi tahu bahwa setelah drive disejajarkan dengan benar, kami harus dapat memulihkan 40-60% ruang kami dengan dedup.

Web
sumber
Itu masalah implementasi NetApp konkret yang menggunakan (untuk alasan lain yang benar-benar dapat dimengerti) ukuran blok statis 4 KB. Alternatifnya adalah potongan yang ditentukan konten berukuran variabel yang tidak memerlukan perataan yang baik.
tuan