Ini mungkin wiki komunitas. Saya mencoba untuk membuat daftar semua tugas sysadmin yang harus kita lakukan secara teratur karena saya percaya kita tidak melakukan cukup di perusahaan kita. Sikap di sini adalah bahwa memperbaiki masalah tidak nyaman, tetapi kami tidak punya waktu untuk melakukan pemeliharaan preventif atau perbaikan berkelanjutan.
Harian:
- tukar tape backup / drive setiap malam
- periksa apakah pembaruan antivirus didorong ke semua sistem
Mingguan:
- swap tape backup / drive mingguan
- membersihkan file sementara dari semua sistem
- defrag semua sistem
Bulanan:
- merencanakan perbaikan infrastruktur
- mengirim / mengirim peralatan usang ke pendaur ulang elektronik
- membangun kembali atau mengganti workstation yang menua
- uji pemulihan dari cadangan
Tahunan:
- membangun kembali atau mengganti server yang menua
- ganti baterai UPS
best-practices
maintenance
Scott
sumber
sumber
Jawaban:
Jika Anda tidak memiliki cukup waktu untuk melakukan pemeliharaan preventif dan menghabiskan sebagian besar waktu Anda untuk menyelesaikan masalah, seluruh metodologi Anda perlu direvisi. Daripada memberi tahu Anda apa yang harus Anda lakukan setiap periode, saya akan memberi Anda beberapa ide sehingga Anda tidak perlu melakukan sesuatu.
Pertama, Anda membutuhkan sistem pemantauan yang baik dan otomatisasi sebanyak yang Anda bisa. Kedua item ini harus membebaskan lebih banyak waktu daripada yang disadari oleh banyak admin sampai setelah mereka mengaturnya dengan baik.
Beberapa hal yang harus dilakukan oleh sistem pemantauan Anda adalah:
Defragging seharusnya tidak ada dalam daftar tugas Anda karena itu harus menjadi proses otomatis. Pada interval yang Anda inginkan minta server menjalankan pemeriksaan disk dan defrag setelah reboot. Pertimbangkan untuk mengikat ini dengan sistem untuk menginstal pembaruan dan tambalan yang antri (yang sebelumnya telah diuji pada mesin non-produksi).
Folder sementara juga dapat dibersihkan dengan otomatisasi. Saya membuat aplikasi sederhana yang dipicu setelah reboot yang menunggu 10 menit dan kemudian membersihkan semua lokasi sementara. Penundaannya adalah untuk memastikan itu tidak menghapus file yang mungkin diperlukan untuk menginstal atau memutakhirkan yang selesai setelah reboot (belajar bahwa itu cara yang sulit!).
Satu hal yang harus Anda lakukan secara manual pada periode waktu apa pun yang cocok untuk Anda adalah memantau sistem pemantauan dan otomatisasi, hanya agar aman. Saya memeriksa tambang setiap hari, tetapi belum benar-benar mengalami masalah selama lebih dari setahun.
Ketika Anda mendapatkan sistem dan otomasi berjalan, pastikan Anda juga memiliki sistem kontrol versi untuk memasukkannya. Ini bisa sangat menjengkelkan untuk menemukan bahwa perubahan kecil terakhir merusak sesuatu yang lain, tetapi Anda tidak dapat mengingat dengan tepat apa yang Anda ubah.
sumber
Dalam Daily, saya akan memeriksa Event Log, baik secara manual atau melalui semacam skrip.
Mungkin Bulanan dapat menyertakan pembaruan OS?
Saya juga akan mengatakan setiap tahun lihat di mana pemeliharaan / garansi di server Anda.
sumber
Bulanan:
Triwulanan:
sumber
Berikut adalah beberapa cadangan bulanan yang mungkin tidak Anda pikirkan:
sumber
Dalam Daily, saya mungkin menyarankan Anda menambahkan berlangganan ke milis kerentanan patch terkenal dan memiliki proses pada patching / pembaruan.
Ini mungkin hanya terjadi sebulan sekali tetapi hanya perlu satu pesan yang terlewat tentang kerentanan produk untuk menyebabkan banyak gangguan.
Saya pikir ini bisa dipangkas menjadi beberapa kata agar sesuai pada satu baris, jika Anda setuju.
BTW; Ini adalah daftar yang bagus, saya berharap untuk melihat penyelesaiannya.
sumber
Audit internal:
sumber