Penyimpanan jangka panjang data Kritis Bisnis

16

Ini benar-benar rumit, dan sampai tingkat tertentu ini bukan masalah teknis, dan mungkin bukan di sini, tetapi

Kesalahan Server adalah untuk administrator sistem ... yang mengelola atau memelihara komputer dalam kapasitas profesional

Dan saya lakukan .. dan ini adalah salah satu tugas saya .. Pokoknya.

Bayangkan Anda memiliki 5000+ halaman A4 dua sisi. Data perusahaan, semua bisnis kritis.
Anda perlu mencadangkannya, entah bagaimana. Solusi yang diajukan sejauh ini adalah:

  1. PDF -> Penyimpanan online
  2. PDF -> DVD / BluRay / Tape
  3. PDF -> HDD / SSD / Flash drive portabel.
  4. Beli / Sewa / Sewa / 'Curi' mesin fotokopi besar, dan buat salinannya.
  5. ???

Masalah langsung dengan yang di atas:

  1. Bagaimana jika mitra penyimpanan bangkrut?
  2. DVD membusuk seiring waktu. Kaset sama.
  3. Ini juga, istirahat dari waktu ke waktu.
  4. Mahal. Lambat. Berat. Tidak Ramah Pohon.

Pertanyaan-pertanyaan):

Apa standar emas untuk pelestarian dan pengarsipan data jangka panjang hingga menengah? Sudahkah Anda memecahkan masalah serupa di tempat kerja?

Setelah pemuatan awal, ada beberapa persyaratan untuk menambah koleksi sekitar 100 halaman sebulan. Pengambilan harus dimungkinkan, mudah, tetapi mungkin jarang.
Idealnya saya ingin menjamin bahwa solusinya akan bisa diterapkan lama setelah saya meninggalkan perusahaan, dan bahwa itu tidak akan membutuhkan jumlah besar untuk mempertahankannya, sehingga menyimpan banyak banyak DVD tidak hanya tidak ideal, tetapi juga tidak solusi jangka panjang yang bagus.

Meskipun hanya membuat salinan kertas tentu saja yang termudah, itu bukan yang paling ramah lingkungan, tidak lama. Ini juga tidak terlalu mudah dikelola, sulit untuk dicari, diindeks, dan sebagainya. Dikombinasikan dengan berat, dan sulit untuk disimpan secara fisik.

Saya sangat menyukai gagasan pada prinsipnya bahwa segala sesuatu disimpan secara elektronik, tetapi mekanisme sebenarnya untuk melakukan ini harus transparan dan mudah. Saya benar-benar tidak ingin bertanggung jawab atas hal ini selamanya dan sehari, mendukung pengguna kantor saat mereka melakukannya, dan kehilangan dokumen. Saya juga tidak ingin bergantung pada vendor penyimpanan tunggal, bagaimana jika Dropbox (Kami memiliki ATM solusi cadangan online, tetapi itu bukan Dropbox.) Akan bangkrut, atau mengalami peristiwa bencana, berapa banyak bisnis yang menggunakan layanan mereka akan naik sungai, tanpa dayung?

Ada beberapa fleksibilitas anggaran di sini, tapi saya curiga ada sesuatu yang harganya lebih mahal dari cadangan online kami saat ini (yaitu sekitar 2500USD / tahun), akan dipandang kurang menguntungkan, dibandingkan dengan hanya meletakkannya di kotak sepatu di bawah tempat tidur. Yang tidak diragukan lagi apa yang akan terjadi jika saya tidak melakukan apa-apa, dan mengundurkan diri besok.

Ada ide?

-Edit-

Ada dua alasan mengapa melakukan hal ini.

1) memberikan cadangan aman yang masuk akal dari dokumen bisnis kritis jika kantor terbakar.

2) untuk memenuhi undang-undang pengarsipan data, WRT, hukum pajak untuk bisnis, dan sebagainya.

Edit 2:

Memiliki beberapa mekanisme untuk mengindeks dokumen akan sangat berguna juga ..

Tom O'Connor
sumber
Saya mengetuk skrip cepat untuk melakukan PDF-> Txt dengan ghostscript dan gocr. Iseng mempertimbangkan menyemprotkan semuanya ke dalam SQLlite db untuk membuat beberapa indeks yang menarik untuk data.
Tom O'Connor
Redundansi (media digital) dan mempertahankan redundansi selama bertahun-tahun mungkin menjadi teman terbaik Anda.
Vortico

Jawaban:

5

Menyimpan data dalam format seperti PDF mungkin aman, karena ada alat gratis untuk membacanya. Volume data yang Anda bicarakan cukup kecil (1.200 halaman / tahun) sehingga bahkan pada resolusi pemindaian 300 dpi Anda hanya berbicara tentang puluhan gigabyte per tahun.

Masalah perangkat penyimpanan fisik tidak akan pernah hilang. Media apa pun yang Anda gunakan untuk menyimpan data elektronik (pita, optik, dll.) Pada akhirnya perlu diperbarui ke media yang lebih baru. Merencanakan dan menganggarkan untuk "menendang data di jalan" ke format baru karena format baru menggantikan format yang lebih lama.

Saya mungkin akan melihat media optik sebagai pilihan pertama hanya karena Anda memiliki sedikit data. Saya juga berencana untuk membakar duplikat 3x dari segalanya dan menyegarkan media setiap 2 - 3 tahun.

Jika media optik terlalu kecil saya akan menggunakan pita KPP dan menyegarkan media setiap 4 - 5 tahun. Itu akan menjadi sangat mahal, untuk sejumlah kecil data.

Evan Anderson
sumber
DVD? Atau Blu-ray? Apakah BR adalah format yang masuk akal untuk data?
Tom O'Connor
1
@ Tom O'Connor: Mereka sepertinya sama bagi saya. Saya akan melihat biaya untuk membuat keputusan itu. Ada "arsip kelas" Blu-Ray kosong di luar sana sekarang, jadi dari perspektif teknis sepertinya format yang layak. (Pabrikan yang mengatakan bahwa media Blu-Ray memiliki masa hidup "berperingkat" selama 200 tahun tidak memberi saya kepercayaan diri yang lebih daripada mereka yang mengatakan bahwa media DVD arsip memiliki masa hidup "berperingkat" 100 tahun ...)
Evan Anderson
Saya memiliki beberapa CD-Rs Kodak GOLD dari sekitar tahun 1998, atau lebih, dan masih dapat dibaca. Saya juga punya beberapa yang gratis, di mana lapisan pewarna telah terpisah, dan mereka kacau.
Tom O'Connor
Saya tidak menyarankan bahwa tidak ada perbedaan dalam media arsip dan non-arsip. Saya hanya mengatakan bahwa media kelas arsip Blu-Ray versus media kelas arsip DVD sepertinya tidak banyak berbeda bagi saya. Membandingkan nilai arsip dengan media "spindle 100 seharga $ 20,00" adalah cerita yang sangat berbeda.
Evan Anderson
Satu item yang tidak disebutkan adalah penyimpanan Solid State (USB thumb drive): Lebih besar dari optik, lebih kecil dari KPP. USB kemungkinan akan ada setidaknya untuk satu atau dua dekade lagi, dan thumb drive 16GB atau 32GB (atau dua, atau tiga) cukup murah dalam hal biaya pengarsipan. Karena ini akan menjadi Tulis-Sekali-Baca-Banyak Anda tidak perlu khawatir tentang sel SSD yang aus, sehingga Anda secara teoritis bisa menyimpan tongkat selama 5 tahun atau lebih dalam lemari besi tahan api.
voretaq7
6

Ada sistem khusus yang secara internal menggunakan DVD dan memigrasikan data ke media baru sesering mungkin. Mencari pelestarian digital.

Karena persyaratan penyimpanan naik dengan cepat, disarankan untuk beralih ke jenis media yang lebih baru dan lebih besar setiap beberapa tahun.

Dengan asumsi Anda mendapatkan data dalam bentuk kertas, Anda perlu:

  1. Daftar data pada entri surat. Ini mungkin berarti memberi setiap lembar barcode unik.
  2. Pindai itu. Gunakan pengidentifikasi kode batang sebagai nama file. Arsipkan kertasnya.
  3. Arsipkan data. Letakkan data pada sistem pengarsipan aman revisi. Server file tidak akan cukup baik karena sesuatu mungkin terjadi pada file jika mereka dapat diakses.
  4. Jadikan ini dapat diakses oleh sistem lain.

Dalam kasus pelanggan, semua faktur untuk organisasi besar yang harus ditransfer ke sistem online (SAP). Penyimpanan arsip telah melalui beberapa iterasi sekarang. Saat ini mereka pindah ke sinar biru.

Di sisi lain, saat ini semuanya masuk ke disk, jadi mungkin sesuatu di sepanjang baris ini akan menjadi cara Anda untuk pergi: http://www.eurostor.com/german/iTernity.D.php

Posipiet
sumber
Perlu diingat bahwa sebagian besar DVD-R (et al) hanya bertahan beberapa tahun sebelum mengalami degradasi. Barang "arsip" yang mahal bertahan lebih lama jika disimpan sesuai dengan instruksi.
Chris S
Begitu juga sebagian besar disk, server, sistem file, atau format dokumen. Pengarsipan berarti memindahkan data. Coba baca pdf dalam 20 tahun. Apakah Anda ingat standarnya 10 tahun yang lalu? Kami tidak memiliki apapun yang mendekati kertas, sungguh. Kecuali untuk salin dan tempel ...
Posipiet
Dokumen teks murni masih bisa dibaca.
Bart Silverstrim
Ada alat gratis untuk membaca PDF. Selama mereka "vanila biasa", aku tidak akan terlalu khawatir. TIFF juga merupakan pilihan yang baik.
Evan Anderson
3

Solusi kami: Pindai ke PDF -> Cadangkan ke Pita

Kami memiliki pemindai dokumen, tidak ~ 30 halaman / menit dan menghasilkan file PDF OCRed. Kami mendukung orang-orang hingga Tape (LTO4 khusus) yang memiliki masa simpan 50 hingga 100 tahun (menemukan tape drive mungkin sulit dalam kerangka waktu, tetapi ada tempat pemulihan data yang masih akan memulihkan disket 8 "di sekitar).

Chris S
sumber
2
Saya harus google 8 "floppy ....
Holocryptic
Saya menyimpan kaset cadangan dari Mac OS 7.5. Tetapi disk rusak, media program cadangan hilang. Saya berhasil menginstal ulang Mac, tetapi saya tidak bisa membaca kaset karena saya tidak memiliki program cadangan. Dan sejujurnya, saya bahkan tidak ingat namanya. Ya, rekaman itu bisa bertahan 100 tahun. Tetapi pembaca tidak.
Posipiet
@ Holocryptic: Hanya beberapa bulan yang lalu saya membuang sekotak Verbatim hard disk 8 "floppy disk yang belum dibuka.
user9517
1
@ Holocryptic: NSFW! NSFW !!
Bart Silverstrim
@Posipiet, saya pikir saya membahas fakta bahwa drive tidak bertahan selamanya tetapi ada perusahaan yang berspesialisasi dalam memulihkan data dari hampir semua media yang biasa digunakan.
Chris S
3

Saya pikir layanan Glacier baru Amazon adalah penawaran menarik di ruang ini.

Amazon Glacier dioptimalkan untuk data yang jarang diakses dan waktu pengambilan yang sesuai untuk beberapa jam. Dengan Amazon Glacier, pelanggan dapat dengan andal menyimpan sejumlah besar atau kecil data hanya dengan $ 0,01 per gigabyte per bulan, penghematan yang signifikan dibandingkan dengan solusi di tempat.

putih
sumber
2
Biaya pengambilan sangat besar.
Tom O'Connor
2

Langkah pertama, Cadangkan: OCR dokumen, dan kemudian atur ulang semua kata menjadi serangkaian novel tentang Gereja Katolik, Opus Dei, dan Templar. Anda harus memiliki data input yang cukup untuk sekitar 10 novel, dan sekitar satu lagi setiap tahun atau lebih selamanya. Mempertahankan tabel pencarian yang menyimpan kata-kata lokasi asli dalam dokumen sumber (dalam urutan sumber), dan lokasi terakhir dalam novel; menyimpan kata-kata rangkap dalam satu entri di tabel. Amankan kesepakatan penerbitan dan dapatkan jutaan novel yang diterbitkan. Gunakan pendapatan dari penjualan buku untuk mendanai OCR dan operasi pengaturan ulang kata. Rusak dokumen asli dan jual sebagai alas tidur hamster. Kadang-kadang mungkin perlu untuk menempatkan pesanan pembelian untuk salib, anti-materi, atau tiket pesawat ke lokasi eksotis, jika Anda menemukan Anda kehilangan kosa kata dari dokumen input Anda.

Langkah dua, Pemulihan / akses: Tidak perlu menyimpan salinan data - yang Anda butuhkan hanyalah tabel pencarian dan toko buku bekas.

Karena tabel pencarian adalah titik kegagalan tunggal Anda, Anda masih perlu mencadangkannya. Berkat skema penyandian huffman yang digunakan, ini akan sangat kecil, dibandingkan dengan dokumen masukan Anda, jadi mungkin bisa disalin ke DVD. Untuk pencadangan di luar kantor, duduk di depan api unggun dan bacakan tabel pencarian, sambil merekam video Anda sendiri. Tempatkan karya video Anda pada perpaduan seni dan teknologi ke Tate Modern Gallery, pada tampilan permanen.

Duncan Lock
sumber
1

Agak terlalu dini untuk membeli tetapi sepertinya HDS telah datang dengan mekanisme penyimpanan data permanen berdasarkan kuarsa - ambil BACA .

Chopper3
sumber
1
Saya telah mendengar klaim keabadian berkali-kali sehingga saya tidak akan percaya dan tidak ada dari kita yang akan hidup cukup lama untuk membuktikannya. Prediksi keabadian sama sekali tidak berharga dan selalu terbukti salah.
John Gardeniers
-2

Saya harus mengajukan Humyo.com (dibeli oleh Trend Micro - siapa nama tengahnya adalah keamanan)

Mereka mengenkripsi semua data pengguna dan server mereka disimpan di Bank Of England dalam lemari besi.

Cukup aman :)

benhowdle89
sumber
1
Saya yakin mereka tidak benar-benar di Bank of England. Tidak ada ruang di sana, penuh dengan bankir.
Tom O'Connor
5
Trend Micro, yang nama tengahnya adalah bloatware ...
Tom O'Connor
Saya setuju dengan Anda di Trend Micro, tetapi mereka hanya memilikinya, Anda beroperasi dengan perangkat lunak Humyo
benhowdle89