Apa tujuan baterai bekerja pada pengontrol RAID caching yang didukung baterai jika server menggunakan catu daya yang tidak dapat terputus?

10

Apakah baterai berlebihan jika server menggunakan UPS yang berukuran tepat? Ada opsi untuk memaksa mode tulis-balik dan saya ingin memahami risikonya. Ini adalah pemahaman saya bahwa itu membantu terhadap kegagalan daya sementara data dalam cache belum ditulis ke disk fisik. Tetapi jika server menggunakan UPS, maka tidak ada risiko kehilangan daya, terutama jika itu adalah UPS yang cerdas dan server dikonfigurasikan untuk mematikan dengan anggun ketika baterai mencapai kondisi rendah. Apakah saya melewatkan sesuatu?

RPC
sumber

Jawaban:

22

Pemahaman Anda pada dasarnya benar.

Mengizinkan pengontrol untuk menyimpan data tulis dalam RAM lokal meningkatkan kecepatan penulisan, namun itu membuat Anda berisiko OS berpikir data telah ditulis ke disk (karena pengontrol memilikinya) dan mengalami kegagalan daya sebelum pengontrol menyelesaikan penulisan itu. . Pencadangan baterai memungkinkan data dalam cache untuk bertahan hingga mesin dihidupkan lagi, mengurangi risiko itu.

Sejauh manfaatnya jika sistem Anda sudah menggunakan UPS, apa yang terjadi jika Anda melebihi runtime UPS Anda (mungkin bahkan dengan UPS yang pintar), atau jika catu daya server meledak? Atau jika seseorang secara tidak sengaja menarik keluar kabel daya?
Banyak hal yang dapat menyebabkan kegagalan daya. UPS hanya melindungi beberapa dari mereka.

voretaq7
sumber
14
Kabel daya yang tiba-tiba ditarik adalah risiko di pusat data PALING!
sysadmin1138
1
Bing di semua titik. Biaya BBWC sangat berharga, kecuali jika datanya benar-benar sementara, Anda dapat menangkap acara dan memulihkan beberapa cara lain, dan Anda hanya ingin meningkatkan kinerja dengan memaksa caching penulisan kembali.
mfinni
3
Tidak ada risiko kehilangan daya? Selain jawaban voretaq7, tambahkan juga: Pemutus sirkuit tersandung, kerusakan UPS ... ada banyak yang bisa salah.
MikeyB
@mikeyB poin bagus tentang pemutus - Saya sudah berada di setidaknya satu DC di mana kaki tenaga A / B sesekali kembali ke satu lantai atau pemutus panel
voretaq7
Terima kasih semuanya atas balasan Anda. @ voretaq7 - server juga memiliki banyak catu daya, beberapa kabel daya, UPS dan juga generator, tapi saya melihat maksud Anda dalam hal desain kartu ini (tidak tahu kotak apa yang mungkin berakhir). @mfinni - itu bagus, tapi kemudian kita akan memiliki masalah yang lebih besar dengan ribuan server turun sekaligus.
RPC
8

Ada dua alasan untuk baterai;

  • Bagaimana jika PSU / s Anda tiba-tiba muncul - terlepas dari UPS sistem Anda sudah mati dan Anda mungkin memiliki data yang tidak dikomit dalam cache Anda, memiliki baterai memastikan bahwa data ditulis dengan benar ketika daya dipulihkan. Hal yang sama berlaku jika Anda mengalami kegagalan systemboard tentu saja.
  • Bagaimana jika ada yang mati pada pengontrol disk, kabel, atau penutup disk Anda yang sebenarnya? - katakan sesuatu tersangkut di kabel dan rusak konektor di kedua ujung - lagi Anda mungkin memiliki data dalam cache Anda menunggu untuk ditulis tetapi tidak ada cara untuk melakukannya karena kartu, kabel, kandang dll mati. Anda mungkin harus mengganti controller, jika Anda memiliki cache yang didukung baterai Anda bisa memindahkan cache itu ke kartu baru tanpa kehilangan data.

Ini adalah kedua alasan yang baik tetapi sejujurnya cache berbasis flash telah mengambil alih dari yang didukung baterai baru-baru ini untuk alasan yang jelas dan saya akan merekomendasikan mereka terlebih dahulu - yang mengatakan jika Anda banyak menulis saya akan merekomendasikan satu atau yang lain lebih hanya sebuah UPS.

Chopper3
sumber
-1

Baterai juga memungkinkan kemampuan untuk memiliki kinerja yang lebih baik serta tujuan yang dicatat oleh voretaq7. Lepaskan baterai dan perangkat masih akan berfungsi tetapi pada kecepatan yang jauh berkurang.

Mitch
sumber
3
Khususnya itu tidak benar dalam kasus ini. @RPC menyatakan secara eksplisit bahwa ia dapat memaksa cache tulis-kembali tanpa baterai pada pengontrolnya. Caching balasan adalah yang meningkatkan kinerja.
mfinni
Sebenarnya saya yakin dia bisa tetapi baterai meningkatkan kinerja secara substansial. Saya telah bekerja melalui pemecahan masalah kinerja yang menurun pada sepasang perangkat penyimpanan HP MSA 20 dan degradasi itu disebabkan oleh baterai Write-Back Cache yang gagal. Baterai diganti dan kinerjanya melonjak.
Mitch
2
Ya saya tahu. Karena pada mesin tersebut, keberadaan baterai memungkinkan caching tulis. Ketika baterai gagal, caching berhenti dan kinerja turun. Ketika baterai diperbaiki, cache-tulis dimulai lagi dan kinerjanya membaik. Kontrolernya memungkinkan dia untuk memaksa caching balasan, yang meningkatkan kinerja , tanpa baterai.
mfinni
Mitch itu masalah yang sangat spesifik, saya tahu pengendali HP E / P / i dengan sangat baik dan untuk kartu-kartu itu Anda benar karena HP membuatnya sangat sulit untuk mengaktifkan cache tanpa baterai - tetapi pertanyaan ini tidak terbatas pada kartu-kartu itu dan ada banyak yang memungkinkan Anda mengaktifkan cache tanpa baterai atau bahkan melakukannya secara default - karenanya perhatian mfinni.
Chopper3
-1

Jika Anda memiliki UPS, Anda dapat memaksa cache aktif dan tidak menggunakan adonan pada serangan itu. Jika Anda kehilangan daya tanpa kartu raid Anda bisa mendapatkan data yang rusak, untuk itulah backup.

Dan hanya karena Anda kehilangan daya bukan berarti sistem Anda bersulang. Cache hanya menampung 256 mcg dan akan disiram / ditulis ke HD sepanjang waktu saat idle. Tidak seperti itu menyimpan semua data dan tidak pernah melepaskannya. Itu selalu memerah.

Sebuah meteor bisa menghantam gedung dan meledakkan segalanya, jangan biarkan kekhawatiran ini membuatmu jatuh. Saya telah menjalankan raid 1 dengan cache aktif dan tanpa baterai tanpa masalah.

Anda bisa benar-benar anal dalam percakapan ini. Mengapa tidak memiliki 4x jatuh server, backup 10x dll. Ini bukan masalah besar.

Nyalakan cache menggunakan UPS Anda. Jika Anda memiliki pukulan ps Anda bisa mendapatkan kembali data dan itu harus meledak selama jam kerja dengan seseorang menggunakan komputer dan memiliki aplikasi yang tepat terbuka, dan menyimpan data pada waktu yang sama dll. Jadi kemungkinannya rendah, dan jika ini bisa diperbaiki dengan mudah.

RAJ
sumber