Apa yang Membuat Penyimpanan Cloud (Amazon AWS, Microsoft Azure, google Apps) berbeda dari jaringan penyimpanan pusat Data Tradisional (SAN dan NAS)?

8

Beberapa kebingungan karena pertanyaan saya sehingga membuatnya sederhana:

"Jenis penyimpanan apa yang digunakan penyedia cloud besar dan mengapa?"

Sejauh yang saya mengerti, namun saya tidak dapat menemukan segala jenis perbedaan jaringan penyimpanan resmi antara pusat data dan cloud, semua penyedia cloud menggunakan DAS berbeda dari pusat data biasa.

Bahkan DAS memiliki banyak kelemahan daripada SAN atau NAS, saya ingin mempelajari detail mengapa cloud menggunakan DAS baik untuk tujuan penyimpanan atau aplikasi.

Sumber atau deskripsi apa pun akan dihargai untuk membuat saya jelas.

EDIT: Saat membaca makalah "Tantangan Jaringan dan Pendekatan yang Dihasilkan untuk Konstruksi Awan Skala Besar, David Bernstein dan Erik Ludvigson (Cisco)" mereka menyebutkan bahwa,

Anehnya kita tidak melihat Awan dari penyedia utama menggunakan NAS atau SAN. Arsitektur Cloud yang khas menggunakan DAS, yang tidak khas dari pendekatan penyimpanan datacenter.

Tapi di sini ada konflik: menurut saya dan juga dinyatakan kemudian di koran, Awan harus menggunakan SAN atau NAS karena DAS tidak tepat ketika VM pindah ke server lain namun masih perlu mengakses penyimpanan dari server asli.

Apa alasan lain efek cloud lebih memilih DAS, NAS atau SAN? penyimpanan apa yang digunakan penyedia cloud besar dan mengapa?

Berkay
sumber
2
Apakah Anda bertanya "Apa perbedaan bagi saya antara menyimpan data saya di cloud dan menyimpan menggunakan SAN atau NAS saya sendiri" atau "Jenis penyimpanan apa yang digunakan penyedia cloud besar dan mengapa"?
Randy Orrison

Jawaban:

4

Jawaban ini telah diedit setelah pertanyaan diklarifikasi.

Apa alasan lain efek cloud lebih memilih DAS

Di mana "DAS" berarti Direct Attached Storage, yaitu drive harddisk SATA atau SAS.

Vendor cloud semuanya menggunakan DAS karena menawarkan peningkatan harga / kinerja yang sangat baik. Ini adalah kasus penskalaan secara horizontal .

Singkatnya, drive harddisk SATA dan pengontrol SATA adalah komoditas murah. Mereka adalah produk pasar massal, dan harganya sangat rendah. Dengan membangun sekelompok besar PC murah dengan drive SATA murah, Google, Amazon, dan lainnya mendapatkan kapasitas besar dengan harga yang sangat murah. Mereka kemudian menambahkan lapisan perangkat lunak mereka sendiri di atas. Perangkat lunak mereka melakukan replikasi multi-server untuk kinerja dan keandalan, pemantauan, replikasi ulang balancing setelah kegagalan perangkat keras, dan hal-hal lain.

Anda bisa melihat MogileFS sebagai perwakilan yang lebih sederhana dari jenis perangkat lunak yang digunakan Google, Amazon, dan lainnya untuk penyimpanan. Tentu saja ini merupakan implementasi yang berbeda, tetapi memiliki banyak tujuan dan solusi desain yang sama dengan sistem skala besar. Jika Anda mau, berikut adalah titik lompatan untuk mempelajari lebih lanjut tentang GoogleFS .

dinyatakan kemudian di koran, Awan harus menggunakan SAN atau NAS karena DAS tidak sesuai ketika VM pindah ke server lain

Ada 2 alasan mengapa SAN tidak digunakan.

1) Harga. SAN sangat mahal dalam skala besar. Walaupun mereka mungkin merupakan solusi "terbaik" secara teknis, mereka biasanya tidak digunakan pada instalasi skala besar karena biaya.

2) Teorema CAP Eric Brewer's CAP teorema menunjukkan bahwa pada skala yang sangat besar Anda tidak dapat mempertahankan konsistensi yang kuat sambil menjaga keandalan yang dapat diterima, toleransi kesalahan, dan kinerja. SAN adalah upaya untuk membuat konsistensi yang kuat dalam perangkat keras. Itu mungkin bekerja dengan baik untuk instalasi 5.000 server, tetapi tidak pernah terbukti bekerja untuk 250.000+ server Google.

Hasil: Sejauh ini vendor komputasi awan telah memilih untuk mendorong kompleksitas mempertahankan status server kepada pengembang aplikasi. Penawaran cloud saat ini tidak memberikan kondisi yang konsisten untuk setiap mesin virtual. Server aplikasi (mesin virtual) dapat macet dan data lokalnya hilang kapan saja.

Setiap vendor kemudian memiliki implementasi sendiri penyimpanan persisten, yang seharusnya Anda gunakan untuk data penting. Penawaran Amazon adalah contoh yang bagus; MySQL , SimpleDB , dan Layanan Penyimpanan Sederhana . Penawaran ini sendiri mencerminkan teorema CAP - contoh MySQL memiliki konsistensi yang kuat, tetapi skalabilitas terbatas. Skala SimpleDB dan S3 fantastis, tetapi hanya pada akhirnya konsisten.

Jesper M
sumber
Sekarang pertanyaannya jelas. Terima kasih untuk tautannya, saya akan memeriksanya.
Berkay
saya memeriksa semua tautan, terima kasih atas jawabannya. Umumnya kita dapat mengatakan bahwa DAS lebih disukai untuk penyedia cloud. Tetapi untuk beberapa aplikasi juga SAN atau NAS dapat digunakan.
Berkay
1

Jika Anda menggunakan DAS maka ketersediaan adalah masalah Anda

Jika mereka menggunakan DAS maka ketersediaan adalah masalah mereka. Dan jika mereka bagus, mereka akan menggunakan beberapa lapis abstraksi untuk memastikan masalah mereka tidak menjadi masalah Anda. Daripada terpaku pada bagaimana mereka memilih untuk memasang disk mereka di dalam pusat data mereka, masalahnya adalah apakah ketersediaan yang mereka jamin dalam SLA mereka memadai untuk kebutuhan Anda. Oh, dan gajah sungguhan di ruangan itu, apa yang Anda lakukan jika mereka gulung tikar (mungkin tidak untuk beberapa penyedia mungkin tetapi Anda harus tetap mempertimbangkannya) dan apa yang Anda lakukan jika Anda menggunakan data ini secara lokal dan koneksi antar jaringan Anda tidak tersedia - yang terakhir jauh lebih mungkin daripada pilihan mereka DAS langsung mengarah ke pemadaman.

Rob Moir
sumber
0

Meskipun saya tidak memegang jawaban pada DAS vs SAN / NAS ... Ada banyak hal yang perlu dipertimbangkan ketika mencari solusi penyimpanan.

Jumlah data? Jika kita mengambil tentang Gb, baiklah, NAS dengan cadangan bisa melakukan pekerjaan itu. Jika ada data terrabytes, harganya naik sangat cepat.

Saya pikir harga adalah faktor utama ... jika Anda memiliki SAN, Anda perlu:

  • Admin untuk mengonfigurasi / mengelolanya.
  • Ruang server (Listrik, bandwidth, langkah-langkah keamanan di sekitar ruangan itu, ...)

Dan tetap saja, Anda tidak memiliki redundansi sama sekali. Jika Anda memiliki akses ke pusat data, semuanya mungkin berbeda.

Satu hal yang perlu dipertimbangkan adalah aksesibilitas. Apakah Anda mengarsipkan? Jika aksesibilitas demikian bukan masalah, beberapa kali per hari / minggu / bulan Anda arsipkan ke solusi penyimpanan Anda.

Jika di sisi lain Anda memiliki data yang harus diakses terus-menerus, Anda dengan cepat menemukan hambatan bandwidth, keterbatasan perangkat keras (seperti I / O). Tetapi di sisi lain jika Anda memiliki jumlah transfer yang tinggi dengan data Anda, ada kemungkinan besar bahwa solusi penyimpanan online sangat mahal.

ROI (Pengembalian investasi) adalah apa yang diiklankan oleh semua vendor solusi penyimpanan online dan mereka sering benar, tergantung pada penggunaannya, tentu saja.

Semoga berhasil.

Embreau
sumber
0

(Hanya opini, dan sangat generalisasi.)

Perbedaannya adalah lapisan abstraksi yang Anda lihat (umumnya).

SAN / NAS biasanya memberi Anda volume, di mana Anda dapat menginstal sistem file. Nilai pendekatan ini untuk sistem-akhir adalah Anda telah mengalihdayakan perincian perangkat keras fisik (mis. Level RAID, lokasi fisik, dll).

Sebaliknya, penyimpanan cloud biasanya memberi Anda antarmuka ke sistem file. Keuntungannya di sini adalah Anda sering mendapatkan fitur tingkat tinggi secara gratis (mis. Dropbox melakukan versi otomatis setiap file, secara transparan).

Caelyx
sumber