Baru-baru ini, salah satu server file utama di perusahaan kami gagal. Itu menggunakan array RAID 4 disk, tetapi ternyata 3 disk mati, dan semua data di server telah hilang.
Berbicara kepada admin sys, dia mengatakan bahwa dia telah memperingatkan manajemen atas tentang situasi cadangan selama berbulan-bulan. Dia telah mencoba untuk mendapatkan persetujuan untuk membeli solusi cadangan tingkat perusahaan, tetapi dia tidak pernah mendapatkan anggaran yang disetujui untuk itu - karena manajemen berpikir itu di atas.
Admin sys adalah admin sys yang berdedikasi dengan benar, sedangkan manajernya tidak berorientasi pada TI.
Manajernya bertanya mengapa dia tidak membeli drive eksternal yang murah dan menggunakan ini untuk membuat cadangan file server. Admin sys berpikir bahwa ini hanyalah solusi mickey-mouse yang cocok untuk digunakan di rumah, tetapi bukan perusahaan IT profesional - itulah sebabnya ia tidak melakukannya.
Sepertinya saya bahwa sys admin menginginkan strategi TI buku teks yang tepat yang membutuhkan biaya lebih banyak, sedangkan manajemen (tanpa pemahaman IT yang mendalam) menginginkan solusi yang lebih murah yang mereka anggap memadai.
Saya bertanya-tanya apa pendapat admin sistem lainnya? Apakah admin sistem ini benar dalam tindakannya? Atau haruskah dia selalu memastikan ada cadangan data penting, bahkan jika dia percaya bahwa cara yang lebih murah tidak cukup baik?
Sunting: berdasarkan jawaban, saya akan menambahkan bahwa admin sys memiliki manajer TI yang pasti sudah mengetahui situasinya. Dia melapor kepada bos utama. Saya tidak tahu apakah manajer pernah melaporkan situasi penuh kepada bos. Saya pikir itu cukup sulit bagi manajer, karena dia terjebak di tengah, dan dia ingin bersikap diplomatis dengan kedua belah pihak.
Jawaban:
Saya setuju bahwa melakukannya dengan benar adalah metode yang disukai. Tetapi, untuk berdiri dan tidak melakukan apa pun adalah tidak profesional. Apakah manajemen diberi tahu bahwa tidak ada cadangan yang tersedia? Adalah tugas admin untuk menyajikan opsi, termasuk biaya dan risiko, kepada manajemen. Dia menyajikan pilihan pilihannya, dan ketika ditolak, dia tidak melakukan apa-apa. Tidak keren.
sumber
jujur saya akan mengatakan itu adalah kegagalan di kedua bagian.
Logistik situasi mungkin berarti dia harus mengambil waktu yang seharusnya dia habiskan untuk melakukan tugas-tugas penting lainnya.
Namun, pada akhirnya, ya, dia seharusnya melakukan sesuatu. Sekelompok hard drive dari sini dan sana akan lebih baik daripada tidak sama sekali seperti yang telah dikatakan berulang kali.
Di sisi lain, seluruh tujuan manajemen adalah untuk memastikan bahwa orang-orang di bawah Anda dapat melakukan pekerjaan mereka, dan melakukannya. dan dengan demikian dari sudut pandang kepemimpinan, para manajer gagal total dan dapat dianggap sama-sama bertanggung jawab, jika bukan lebih dari itu.
sumber
Jika tidak ada cadangan, sejauh yang saya ketahui adalah tanggung jawab sysadmin untuk:
1) Secara eksplisit memberi tahu para petinggi bahwa tidak ada cadangan, tanpa syarat yang tidak pasti, sehingga mereka menyadarinya
2) Buat cadangan data, apa pun yang dia bisa
Terus terang saya berharap akan dipecat jika ini terjadi, karena bahkan jika manajemen membuat hidup saya sulit, itu bukan alasan, terutama jika mereka masih di bawah kesan bahwa mereka memiliki sesuatu daripada tidak sama sekali.
sumber
Terkutuklah jika Anda melakukannya, terkutuk jika Anda tidak. Terus terang, jika tidak ada uang yang dihabiskan oleh manajemen untuk solusi cadangan, maka itu kesalahan mereka. Di sisi lain, admin seharusnya aktif dalam mencoba mencari solusi sementara, daripada hanya duduk di pantatnya menunggu sesuatu untuk istirahat (saya tidak berpikir segala macam solusi drive eksternal dapat diterima. Anda tidak akan pernah mendapatkan cadangan yang layak dengan itu.) Anda tidak bisa hanya mengatakan, "Yah saya tidak memiliki apa yang saya inginkan , jadi saya tidak bertanggung jawab" tetapi Anda dapat mengatakan, "Saya sudah berulang kali mencoba untuk mendapatkan Anda untuk melakukan sesuatu dan Anda tidak memberi saya apa - apa dan ini bukan masalah saya. "
Saya benar-benar dalam situasi sekali - saya bahkan tidak ADMIN di pekerjaan ini - di mana saya bekerja pada database, dan membuat cadangan sebelum saya mengubahnya (yang sop), dan saya (seperti biasanya saya lakukan , kapan pun saya bisa) menyimpannya ke mesin lokal saya sendiri. Dua hari kemudian mereka kehilangan susunan serangan, dan ooops, ternyata tidak ada solusi cadangan. Mereka telah mem-backup database ke array raid.
Jadi saya datang terlambat dalam hal ini, dan saya berkata, "Oh, saya mencadangkannya sendiri sehari sebelum kemarin."
Anda tahu apa hasilnya? Saya dikecam karena solusi cadangan buruk saya . Untuk mesin yang saya tidak bertanggung jawab sama sekali. Dan itu bukan karena cadangan yang saya miliki sudah terlalu tua, itu karena saya hanya mendukung database yang saya kerjakan, tidak setiap database.
Jadi masalahnya adalah ini: jika Anda melakukan solusi mickey mouse, jika Anda melakukan sesuatu, dan itu tidak cukup baik, Anda akan mendapatkan neraka sebanyak jika Anda tidak melakukan apa-apa sama sekali. Jika cadangan adalah tanggung jawab Anda, secara eksplisit, dan tidak ada anggaran, Anda harus mencoba menyatukan sesuatu, tetapi Anda lebih baik memastikan itu berfungsi, dan Anda perlu mengacaukannya. Berkali-kali. Di setiap kesempatan.
Jika itu bukan tanggung jawab Anda, tunjukkan bahwa ada masalah, dan secara mutlak, pasti, menolak untuk bertanggung jawab atas mandat yang tidak didanai ketika mereka mencoba untuk memberikannya kepada Anda. Tidak ada yang menjadikan pemulihan bencana sebagai prioritas sampai ada bencana, dan kemudian mereka mengkambinghitamkan semua orang untuk mencoba dan menebus kesalahan mereka sendiri.
sumber
Sayangnya, perusahaan yang menghemat cadangan sering terjadi. Kebanyakan tidak pernah berubah sampai mereka terbakar dan kehilangan segalanya.
TAPI
Jika Anda dipekerjakan untuk menjadi sysadmin Anda harus bekerja dengan alat yang Anda miliki termasuk otak Anda. Tidak peduli apa yang manajemen atau orang lain katakan pada hari-hari baik, ketika kotoran menghantam kipas, setiap orang mendapat memori selektif.
Cadangan mickey mouse lebih baik daripada tidak ada cadangan sama sekali.
sumber
Bagi saya kedengarannya seperti sysadmin menginginkan semua atau tidak sama sekali. Sangat menyenangkan untuk mendapatkan semuanya, tetapi jika Anda tidak dapat memilikinya, Anda harus menerima apa-apa?
Dalam pengalaman saya, hal yang harus dilakukan adalah mengevaluasi semua opsi yang mungkin, (tidak terlalu mendalam), dan menyusun beberapa poin untuk masing-masing menunjukkan pro dan kontra, biaya (baik inital dan yang sedang berlangsung). Masukkan dalam opsi "tidak melakukan apa-apa" ini.
Kemudian Anda mengizinkan manajer untuk memutuskan solusi apa yang mereka pilih. Tampaknya bagi saya bahwa mungkin ada lebih dari satu opsi yang memungkinkan untuk sysadmin Anda. Mungkin dia hanya melihat yang benar-benar dia inginkan?
sumber
Saya akan menambahkan suara saya kepada mereka yang mengatakan bahwa admin seharusnya mengimplementasikan sesuatu di sini. Dia salah besar karena tidak melakukannya. Ada bagian dari diri saya yang ingin bersimpati dengan posisinya, tetapi dalam dunia yang ideal, pencadangan dan pemulihan tidak membutuhkan waktu, selalu bekerja, dan tidak pernah dibutuhkan. Ini bukan dunia itu dan bahkan solusi cadangan terbaik akan memiliki kekurangan yang Anda harus terima dan pelajari untuk bekerja dengannya.
Half-assed lebih baik daripada no-assed, dan bahkan menggunakan el-cheapo USB HD akan membuatnya keluar dari hutan, dan akan memberi bobot pada posisinya ketika manajemen diberitahu bahwa mereka tidak bisa mendapatkan data lebih dari hari. atau dua punggung lama. Tapi itu masih akan menyelamatkan lehernya dalam kasus ini.
sumber
Saya tidak tahu bahwa saya akan mengatakan Anda harus membuat cadangan dalam kondisi apa pun . Ada beberapa hal yang Anda mungkin tergoda untuk melakukannya yang mungkin ilegal. Misalnya saya tidak akan membuat cadangan catatan kesehatan melalui jaringan ke komputer pribadi saya. Saya tidak akan melakukan sesuatu yang ilegal hanya untuk memiliki cadangan.
OTOH untuk memiliki setidaknya beberapa sistem cadangan di tempat saya akan menerima banyak kompromi. Kemudian, setiap kali kompromi dibuat, saya akan membuat titik untuk memastikan keberatan saya jelas dan didokumentasikan tentang mengapa itu adalah kompromi buruk yang akan menyebabkan masalah, tidak memadai, atau menjadi kurang berguna di masa depan.
sumber
Sebagai seorang sysadmin, saya percaya ini adalah tanggung jawab saya untuk memastikan sistem yang saya kelola aman dan dapat diandalkan seperti yang saya bisa lakukan. Cadangan berada di bawah tag keandalan. Frustasi karena mungkin harus berdebat dengan staf senior yang tidak mengerti (saya pikir kita semua pernah ke sana pada suatu waktu), kita masih harus melakukan pekerjaan kita sebaik mungkin.
Ketika sistem cadangan yang saya warisi dalam posisi saya saat ini gagal dan manajemen ragu-ragu untuk menghabiskan uang pada sistem yang saya inginkan, saya tidak meninggalkan sistem tanpa cadangan. Sebagai gantinya, saya membawa drive eksternal pribadi saya dan menggunakannya selama sekitar satu minggu. Meskipun memiliki kebencian mutlak untuk menggunakan hard drive untuk backup, faktanya tetap bahwa itu jauh lebih baik daripada tidak memiliki sama sekali.
sumber
Jika sysadmin tidak dapat meyakinkan manajemen tentang pentingnya solusi cadangan yang baik, satu-satunya cara mereka dapat diyakinkan adalah melalui kehilangan data yang sangat besar, tetapi sebagai sysadmin adalah tanggung jawab Anda untuk mengedukasi manajemen dan pengguna tentang pentingnya hal-hal seperti cadangan , dan untuk memastikan mereka benar-benar memahami keadaan saat ini (dalam hal ini "tidak ada cadangan") dan konsekuensi potensial ("Kami kehilangan disk dan data berharga Anda hilang selamanya").
Pendapat pribadi saya adalah bahwa admin agak kacau di sini: Pencadangan Ad-Hoc adalah ide yang buruk (Anda akan kehilangan barang-barang, data penting akan hilang, jika Anda tidak berada di sekitar pencadangan tidak terjadi), tetapi pada saat yang sama waktu mereka seharusnya dapat menemukan solusi cadangan "perusahaan" yang dapat diandalkan dalam anggaran perusahaan.
Perangkat lunak seperti Bacula dan Amanda tersedia gratis, dan keduanya dapat bekerja dengan media USB dan CD yang dapat dilepas dengan aman dan andal. Termasuk biaya media dan perangkat keras server Anda dapat memiliki sistem yang baik dengan harga kurang dari $ 2000 AS - bahkan lebih murah jika Anda mendaur ulang perangkat keras untuk server.
Sekarang jika manajemen juga menentang admin yang menghabiskan WAKTU untuk mendapatkan cadangan yang berfungsi, tidak ada yang membantu perusahaan ini: Seperti yang saya katakan di atas kadang-kadang satu-satunya cara untuk mengajar orang adalah kehilangan data yang sangat besar, dan jika itu masalahnya menyebalkan bagi admin miskin yang harus disalahkan atas kebodohan institusional.
sumber
Pendapat pribadi saya adalah tugas saya sebagai sysadmin untuk menginformasikan dan memberi kesan kepada manajemen tentang perlunya dan pentingnya memiliki solusi cadangan yang memadai dan sesuai serta meminta anggaran yang diperlukan untuk hal tersebut, dan untuk menjelaskan risiko yang terkait dengan tidak melakukannya. Bukan tanggung jawab saya untuk pergi "ke luar" dari mandat manajemen dan hanya melakukan apa pun yang menurut saya benar terlepas dari seberapa buruk keputusan manajemen itu. Bukan tanggung jawab saya untuk mengoceh bersama-sama beberapa solusi setengah matang, setengah matang.
Jika saya seorang agen asuransi dan saya katakan kepada Anda, penting untuk memiliki cakupan kebakaran dalam polis pemilik rumah Anda, dan jika saya cukup menjelaskan risiko tidak memiliki cakupan kebakaran, dan Anda menolak mengatakan cakupan kebakaran, dan rumah Anda terbakar, siapa yang tanggung jawab bukan? Haruskah aku memberimu perlindungan kebakaran?
Pendapat saya adalah bahwa sysadmin melakukan uji tuntas dalam melaksanakan tugasnya dengan membawa masalah tersebut menjadi perhatian manajemen, menjelaskan pentingnya memiliki solusi cadangan yang sesuai, menjelaskan risiko tidak memilikinya, dan meminta anggaran yang diperlukan untuk seperti itu. Jika dia ditolak dalam upayanya maka tanggung jawab terletak tepat di pundak manajemen.
Orang-orang membuat keputusan yang buruk sepanjang waktu dan hal-hal buruk terjadi karena keputusan yang buruk itu, itulah fakta kehidupan. Saya tidak dapat bertanggung jawab atas setiap keputusan buruk yang dibuat bos saya, terlepas dari risiko yang terkait dengan keputusan itu.
sumber
Apakah situasi yang sama terjadi dengan array RAID? Segera setelah satu disk mati, Anda berada dalam situasi di mana satu lagi berarti kehilangan data .. Anda sebaiknya segera mengganti drive itu.
Jika saya berada di posisi sys admin, instan drive pertama pergi:
Jika Anda ditolak sepanjang jalan, setidaknya Anda memilikinya secara tertulis ketika kotoran itu mengenai penggemar (Dapatkan secara tertulis / email, jangan terima tanggapan verbal. Anda perlu jejak kertas di sini. Jika manajer Anda menolak untuk menulis itu, lalu pergi ke kepalanya, karena itu hanya teduh - tidak ada alasan yang sah untuk tidak menuliskannya.)
Proses yang sama seharusnya diikuti untuk mendapatkan sistem cadangan, meskipun mungkin tanpa eskalasi secepat (atau membahas kepala manajer Anda sama sekali). Jika tidak ada permintaan tertulis, yah .. gulungan menuruni bukit. Setidaknya itu pelajaran hidup yang baik.
Jika Anda tidak kehilangan pekerjaan karena situasi itu, yah, mulailah membuat permintaan itu lagi, mengutip bencana yang disebabkannya terakhir kali permintaan Anda ditolak. Jika masih ditolak, maka Anda perlu memutuskan apakah itu lingkungan tempat Anda ingin bekerja, dan itu layak untuk ditekankan. Jika setiap pagi Anda berharap untuk masuk kerja mencari kepanikan karena data hilang, yah, itu bukan cara hidup.
sumber
Perusahaan ini jelas mencari kambing scape dalam hal ini, sys admin benar untuk tidak membuat cadangan data penting ke perangkat yang dapat dilepas.
1) Mereka tidak dapat diandalkan 2) Mereka tidak aman
Pada akhirnya terletak pada manajer untuk tidak memastikan solusi DR (Disaster recovery) yang tepat diterapkan.
Lihatlah dengan cara ini, berapa banyak kehilangan data yang harus ditanggung perusahaan? Tiba-tiba saya yakin solusi "di atas" tidak terlihat terlalu mahal.
sunting: ya saya mengakui fakta bahwa cadangan apa pun lebih dapat diandalkan daripada tidak sama sekali, tetapi poin awal saya tetap ada jika orang ini memiliki manajer, manajer harus memastikan cadangan itu ada di tempat, saya tidak mengampuni admin sistem dari semua yang disalahkan di sini, tapi ini yang harus diperiksa manajer.
Dan bagaimana jika server gagal dan data pada removable drive tidak dapat dipulihkan karena alasan apa pun? memiliki ini terjadi sendiri di drive USB masa lalu jauh dari dapat diandalkan, tetapi untuk beberapa mereka dapat digunakan dalam "cubitan" masalahnya adalah seperti yang terlihat dalam hal ini manajemen akan memungkinkan cadangan drive yang dapat dilepas untuk digunakan dalam jangka panjang Lari.
sumber