Seberapa Seringkah Server Windows Perlu Diaktifkan Ulang?

77

Sedikit latar belakang: Kami memiliki beberapa server Windows (2003, 2008) untuk departemen kami. Kami adalah divisi dari TI sehingga kami mengelola server kami sendiri. Dari kami berempat di sini saya satu-satunya dengan sedikit pengetahuan IT. (Catat "jumlah sedikit".) Bos saya mengatakan server harus dimulai ulang setidaknya setiap minggu. Saya tidak setuju. Departemen IT kami mengatakan bahwa karena dia menyalakannya kembali terus menerus itulah alasan mengapa hard drive kami gagal dan catu daya padam. (Itu terjadi pada beberapa server kami beberapa kali selama empat tahun terakhir, dan baru-baru ini.)

Jadi pertanyaannya adalah: Seberapa sering setiap orang me-restart server Windows mereka? Apakah ada standar atau rekomendasi industri? Apakah departemen TI kami benar mengatakan bahwa karena kami memulai kembali itu sebabnya kami mengalami masalah perangkat keras? (Aku butuh alasan jika aku akan berubah pikiran!)

Evan
sumber
111
Oh, setiap Selasa kedua setiap bulan . :)
jscott
4
Dang! Kami melakukan setiap Kamis keempat bulan ini! :)
Evan
2
Saya di kapal yang berlawanan. Kami tidak diizinkan untuk me-reboot server tanpa debat bolak-balik selama seminggu di antara seluruh departemen yang memakan waktu sekitar 12 jam per server. Ya, ini termasuk reboot untuk ditambal, yang secara efektif berarti itu tidak pernah selesai.
Hyppy
19
Memulai ulang setiap minggu tidak seharusnya menyebabkan peningkatan kegagalan perangkat keras secara drastis.
JamesRyan
3
Sepertinya server Anda bisa di-reboot lebih sering daripada laptop saya. Saya biasanya dalam mode tidur ketika saya tidak menggunakannya. Alasan biasa melakukan reboot adalah menginstal pembaruan windows atau perangkat lunak.
Phil

Jawaban:

116

Bos saya mengatakan server harus di-restart setidaknya setiap minggu

Saya sangat tidak setuju. Microsoft telah membuat langkah besar sejak hari baik [NT, siapa pun?] Berkaitan dengan stabilitas dan waktu kerja. Sayang sekali konsensus dalam dukungan TI tidak berubah seiring dengan ini.

Seberapa sering setiap orang me-restart server Windows mereka?

Hanya ketika diperlukan - Entah karena pembaruan OS / perangkat lunak, kegagalan perangkat lunak kritis yang tidak dapat dipulihkan melalui metode lain, peningkatan / penggantian perangkat keras atau aktivitas lain yang tidak dapat terjadi tanpa restart. 1

Apakah ada standar atau rekomendasi industri?

Aku belum pernah melihat rekomendasi standar, per se , tapi aku bisa tidak setuju dengan rekomendasi [kecuali dari MS sendiri] yang akan menunjukkan reboot diperlukan pada interval waktu tertentu "hanya-karena".

Apakah departemen TI kami benar mengatakan bahwa karena kami memulai kembali itu sebabnya kami mengalami masalah perangkat keras?

Memulai kembali [dan, lebih dari itu, bersepeda dengan tenaga] adalah periode yang paling menegangkan dari aktivitas perangkat keras untuk komputer. Anda memiliki hampir semua yang berputar hingga 100% - disk dan kipas ... ... serta fluktuasi suhu komponen yang signifikan. Perangkat keras modern sangat ulet, tetapi itu seharusnya tidak menjadi alasan untuk hanya memantulkan server, sambil iseng, beberapa kali seminggu.

1 Selain itu, saya tidak suka ketika teknisi "hanya" me-reboot server Windows jika ada layanan yang gagal, atau sejenisnya. Saya mengerti perlunya menjalankan layanan lagi, tetapi reboot harus menjadi langkah terakhir dalam masalah memotret server. Mengidentifikasi, dan memperbaiki [!], Akar penyebab kegagalan hampir tidak pernah menghasilkan "Meh, reboot saja ...."

jscott
sumber
2
Terima kasih atas jawabannya. Kami melakukan pembaruan sebulan sekali, yang jelas ketika kami melakukan itu, kami harus memulai kembali. Saya menghargai jawabannya.
Evan
5
Saya harus tidak setuju dengan adendum Anda. Jika layanan menentukan server (misalnya server NFS yang berhenti berbagi ekspor), dan Anda tahu bahwa reboot bersih akan memunculkan kembali layanan dalam X menit, dan setelah pemecahan masalah dasar, Anda menentukan akan membutuhkan x + 5 untuk menyelesaikan masalah, itu paling bijaksana untuk hanya reboot. Anda dapat melakukan analisis sebab sesudahnya. Sekarang, itu adalah metode saya untuk melakukannya, dan Anda bisa berdebat dengan mudah dan tidak mudah :) Hanya bagaimana saya menggulung.
Matius
34
@Matthew: Melakukan analisis akar masalah setelah semua fakta adalah baik dan bagus jika tidak ada informasi sementara tentang penyebab yang hilang karena me-reboot. Saya pikir saya berbicara untuk sejumlah orang ketika saya mengatakan bahwa saya lebih suka memiliki satu lagi downtime diperpanjang untuk menemukan dan memperbaiki akar penyebab pemadaman daripada sejumlah insiden downtime yang lebih pendek ketika saya memutuskan untuk "hanya reboot" dan berpotensi kehilangan kemampuan untuk menggunakan informasi yang mudah menguap untuk membantu dalam analisis akar penyebab.
Evan Anderson
8
@ Matius Dalam kasus kegagalan layanan, saya berharap teknisi mencoba memulai kembali layanan , sebagai langkah pemecahan masalah, sebelum mem-boot ulang seluruh kotak.
jscott
6
@ Evan, saya setuju dengan Anda, tetapi saya pikir harus ada ambang insiden yang menjadi masalah. Misalnya, jika terjadi sebulan sekali dan diselesaikan dalam 10 menit dengan reboot, bisnis mungkin tidak pernah peduli tentang penyebab root. Saya pikir Anda dan saya ingin tahu tetapi waktu aktif lebih penting daripada penyebab utama. Namun jika itu terjadi 3 kali seminggu, itu adalah cerita yang berbeda.
Jim B
52

Server Windows harus di-reboot setiap bulan, jika Anda menerapkan tambalan. Anda menerapkan tambalan, bukan? Baik?

Hipn
sumber
8
+1 untuk membuat saya tertawa
3
Anda hanya menerapkan tambalan setiap bulan?
John Gardeniers
Sebenarnya, xe hanya menerapkan tambalan yang membutuhkan reboot setiap bulan. Tidak semua PTF memerlukan reboot, dan tidak semua pembaruan bulanan bahkan mengandung perbaikan seperti itu sama sekali.
JdeBP
2
Saya hanya me-reboot server Windows ketika pembaruan membutuhkannya . Kadang-kadang akan berjalan beberapa bulan tanpa tambalan yang membutuhkan reboot. Namun, saya punya server linux yang belum reboot dalam beberapa tahun dan berjalan tanpa hambatan. Saya pikir yang terpanjang yang pernah saya lihat di jaringan saya adalah kotak linux yang dimasukkan ke dalam lemari dan dilupakan (itu memang mendapatkan pembaruan otomatis). Saya masuk dan waktu aktifnya adalah 3 tahun. Setahun kemudian ia reboot karena catu daya gagal.
James
Jika itu linux, atau BSD, Anda bisa menambal server Anda tanpa perlu reboot. Anda hanya harus reboot untuk pembaruan kernel (dan dengan distro berorientasi server, itu jarang terjadi).
SnakeDoc
18

Saya akan memberikan jawaban alternatif untuk kasus yang sangat spesifik. Kemajuan 2-3 tahun terakhir mungkin telah mengubah ini, tetapi jika Anda memiliki server TS atau Citrix yang banyak digunakan yang menjalankan banyak aplikasi interaktif (seperti Office), merupakan ide bagus untuk melakukan reboot mingguan di luar jam kerja, hanya untuk memulai dari batu tulis bersih untuk sumber daya seperti sesi macet, tumpukan desktop bekas, dll. Jika peternakan Anda sudah diatur dengan benar dan membuat terhuyung-huyung reboot, bahkan jika Anda menggunakan lampu di luar jam kerja, pengguna tidak akan terpengaruh.

Tentu, ini adalah reboot server secara teratur, tetapi mereka digunakan seperti desktop.

mfinni
sumber
4
Mm ... panggilan bagus untuk kasing TS / Citrix.
Hyppy
Pengalaman serupa di sini menggunakan Citrix dengan perangkat lunak manajemen audit CCH.
1
Hal yang sama diterapkan kembali pada hari-hari MetaFrame, ketika Citrix sendiri merekomendasikan reboot malam jika itu praktis.
John Gardeniers
Ya, Metaframe ... whoof. Saya tidak ketinggalan bermain dengan file pemetaan driver printer. Ini tentu saja menjadi jauh lebih baik dari perspektif manajemen TI.
mfinni
10

Ini lebih merupakan masalah politik dan psikologis daripada masalah teknis.

Dalam pengalaman saya, orang - orang tertentu yang bekerja dengan beberapa versi windows yang jauh lebih tua berpikir bahwa mereka perlu reboot setiap minggu, dan mereka telah mengabadikan filosofi itu di sudut kecil pikiran mereka (mereka sepertinya tidak pernah memperhatikan ketika suatu reboot tidak terjawab ketika mereka sedang berlibur). Kecuali Anda memiliki beberapa sistem dan aplikasi yang sangat tidak stabil, itu tidak lagi berdasarkan kenyataan.

Di sisi lain, reboot sering dapat memicu kegagalan perangkat keras, tetapi tidak terlalu mungkin menjadi penyebabnya.

Shane Madden
sumber
7
Bos saya adalah teman baik dengan pensiunan administrator jaringan yang mengatakan kepadanya bahwa mereka perlu di-boot ulang setidaknya setiap minggu ... yang menjelaskan mengapa dia sangat bersikeras tentang hal itu. Terima kasih atas jawabannya.
Evan
5
Tidak heran dia "pensiunan" ... apakah itu eufemisme untuk dipecat?
KCotreau
3

Satu-satunya waktu mereka harus dihidupkan ulang adalah untuk pemeliharaan jika semuanya berfungsi dengan benar . Reboot terjadwal benar-benar hanya persyaratan ketika A) memperbarui perangkat lunak, B) melakukan pemeliharaan perangkat keras, atau C) berurusan dengan kebocoran memori yang tidak dapat diselesaikan dengan me-restart perangkat lunak / layanan yang menyebabkannya. Sementara windows tidak dikenal untuk waktu yang lama, itu memang terjadi (pekerjaan terakhir memiliki beberapa kotak Win2k yang naik selama berbulan-bulan pada suatu waktu - mereka hanya bekerja). Ingatlah bahwa setiap perbaikan kemungkinan besar membutuhkan reboot.

Matius
sumber
Terima kasih atas jawabannya. Ini akan membantu membujuknya.
Evan
1
Saya telah menemukan windows NT, 2000 dan 2003 Boxes di jaringan kerja yang telah berjalan dan berjalan selama beberapa tahun. dan hingga saat ini pusat data kami memiliki kebijakan penambalan tahunan dan dengan lebih dari 600 server, tidak jarang untuk melihat waktu dalam rentang 250+ hari. Server saya (saya punya sekitar 120) Dapatkan pembaruan dan boot ketika setiap patch Microsoft. Terkadang, seperti bulan lalu kami tidak memiliki siklus. Uptime tergantung pada apa yang berjalan di server dan seberapa baik semuanya bekerja bersama. 2003 R2 dengan hal-hal yang harus saya jalankan harus reboot setiap 35 hari. hal-hal lucu terjadi setelah itu.
Christopher Thornton
2

Saya sama sekali tidak ahli dalam hal ini, tetapi tergantung pada layanan apa yang telah Anda jalankan, beberapa mungkin rentan untuk meluap pada fungsi waktu tertentu, seperti timeGetTime () dan getTickCount ().

timeGetTime memiliki hasil 32bit, yang sama dengan jumlah milidetik sejak komputer dimulai. Ini maksimal sekitar 49,7 hari.

Matius
sumber
2
Err, tidak. Saya memiliki sebuah server (pada benar-benar terisolasi, jaringan terpercaya - tidak memberitakan kepada saya) yang telah untuk bagian terbaik dari 14 bulan dengan NO efek sakit.
Ben Pilbrow
3
Saya tidak bermaksud mengatakan bahwa setiap server dan instance akan memiliki masalah ini, tetapi jika server menggunakan perangkat lunak yang menggunakan fungsi-fungsi ini dan tidak memperhitungkan hal tersebut akan menghadapi masalah komputasi.
Matius
2
Masalah pengatur waktu 32-bit valid, tetapi ini adalah masalah yang harus dihindari masing-masing vendor perangkat lunak dengan kode mereka sendiri. Windows tidak lagi rentan terhadap kegagalan yang terkait dengan timer ini (seperti di masa lalu), tetapi jika Anda memiliki perangkat lunak yang diinstal yang tidak memperhitungkan rollback timer, maka itu dapat menyebabkan efek yang tidak terduga.
tylerl
1
Apakah Anda merujuk ke Microsoft KB ini ?
jscott
9
Kesalahan ini adalah bug NT 4 win 2k + jangan menderita ini. Saya pikir kita dapat dengan aman mengatakan NT 4 mati pada tahun 2011. dan jika seseorang menjalankannya ... mereka layak mendapatkan apa yang mereka dapatkan saat ini.
Zypher
2

Saya biasa me-restart semua server Windows saya setiap minggu dan pasti ada waktu ketika itu diperlukan. Hari ini saya hanya me-restart mereka ketika pembaruan membutuhkannya. Tentu saja itu berarti mereka masih bisa memulai kembali setiap beberapa minggu.

John Gardeniers
sumber
2

Microsoft telah melakukan pekerjaan yang baik untuk meningkatkan OS server mereka selama bertahun-tahun. Dan beberapa server Anda dapat berjalan selama 6 - 12 bulan sebelum mereka mulai mengalami masalah, beberapa hanya membuatnya 2 - 3 bulan. Itu semua tergantung pada layanan dan aplikasi apa yang server jalankan. Tetapi mereka semua akan memiliki masalah di beberapa titik. Pembaruan Windows, kebocoran memori, perangkat lunak yang tidak sempurna, hanyalah beberapa alasan.

Untuk klien kami dengan kontrak pemeliharaan, kami memasang pembaruan dan me-reboot server mereka setiap bulan. Klien-klien ini memiliki masalah server yang tidak direncanakan yang jauh lebih rendah, dengan urutan 1/5 sebanyak masalah yang tidak di-reboot secara teratur.

Bagi mereka yang mengatakan me-reboot menyebabkan kegagalan perangkat keras prematur, ada waktu ketika me-restart hard drive dan sistem adalah masalah potensial. Namun saat ini HDD dan komponen lainnya dibuat untuk menahan ribuan siklus penghentian start. Jika perangkat keras server Anda lemah, apakah Anda lebih suka mengetahuinya pada waktu yang terkendali ketika Anda berada di sana untuk mengatasi masalah dengan cepat, atau kegagalan acak dengan panggilan di tengah hari kerja yang mengatakan departemen sedang down?

Saya merasa tidak ada kerugian untuk memulai ulang bulanan secara teratur, sementara sisi baiknya jelas dan terbukti seiring waktu.

Todd H
sumber
1

Saya mengandalkan pembaruan windows untuk mengkonfigurasi 'jadwal reboot' saya. Biarkan Windows mengelola sendiri .. untuk sekali! Hanya sangat jarang reboot diperlukan dengan pengaturan kami karena kebocoran memori ...

Lebih lanjut
sumber
1

Saya seorang administrator jaringan dengan perusahaan yang beroperasi di beberapa server Windows 2003 2008. Saya me-restart server setiap bulan, biasanya tidak menunggu lebih dari 3 bulan, karena sangat penting untuk turun dalam waktu singkat.

Namun, dengan tambalan dan pembaruan windows saya akan menginstal WSUS pada pengontrol domain untuk menerapkan pembaruan dll pada jadwal berdasarkan keinginan saya. Ini untuk menghindari server memperbarui diri dan me-reboot ...

GMitch
sumber
1

Semua yang Anda Pembenci Windows harus memeriksa Situs Netcraft.com dengan sistem berjalan terpanjang berdasarkan waktu rata-rata ( http://uptime.netcraft.com/up/today/top.avg.html ). Ini menunjukkan situs yang telah berjalan paling lama sejak reboot terakhir mereka dan 95% dari 50 teratas adalah Windows 2003 dan 2000 mesin. Seperti biasa, jarak tempuh Anda mungkin berbeda.

Mark Lawrence
sumber
Mungkin Anda tidak tahu terlalu banyak tentang penyeimbangan beban ...
mfinni
0

Menentukan hanya Windows mungkin terlalu luas untuk membuat keputusan yang masuk akal. Bahkan, Anda akan mengambil keputusan yang lebih baik jika Anda mempertimbangkan layanan, peran, dan fitur yang Anda jalankan di mesin Windows (misalnya: Layanan Web, Server Database, dll).

Kualitas dan perilaku aplikasi pihak ketiga dan layanan web yang dijalankan pada server tertentu dapat menyarankan permintaan restart mesin Windows yang lebih banyak dan lebih jarang daripada mesin lain tanpa mereka.

Sebenarnya beberapa aplikasi pihak ketiga (yang tidak dirancang dengan sempurna; meskipun tidak ada yang sempurna! ) Mungkin gagal untuk merilis sumber daya sistem yang diperoleh seperti memori, kunci, dan soket dengan cara yang anggun dan tepat waktu. Sebagai contoh, ini dapat membuat beberapa aplikasi, layanan, atau driver yang macet [, ketika dijalankan kembali,] dalam status tertunda atau mulai yang mungkin tidak mudah diperbaiki tanpa reboot.

Dalam praktiknya, aplikasi Disk I / O, Jaringan dan Memori haus di bawah beban kerja yang tinggi dan stres dan dengan sumber daya sistem yang rendah tersedia dapat membuat mesin Windows Anda tertinggal, tidak stabil atau trash yang mungkin menyarankan Anda untuk memulai kembali lebih cepat.

Jika Anda harus menjalankan aplikasi yang salah atau harus melayani lebih banyak pengguna daripada kapasitas khas perangkat keras / lunak Anda, atau Anda dipaksa untuk menemukan lokasi layanan yang tidak kompatibel ke dalam satu mesin fisik, Anda dapat mengambil keputusan sedemikian rupa sehingga Anda harus me-restart Windows Anda secara berkala. Dalam hal ini Anda dapat menyesuaikan periode restart dengan mendengarkan keluhan pengguna tentang kecepatan server!

FIV
sumber
-6

Jawaban yang benar tidak pernah kecuali Anda melakukan peningkatan perangkat lunak. Terakhir kali saya reboot server saya sekitar 2 tahun yang lalu dan alasannya adalah kegagalan daya.

Dmitriy R
sumber
3
Saya harap Anda berbicara tentang server linux atau saya harap server Anda tidak digunakan secara profesional ...
HTDutchy
3
Setiap server yang ditambal perlu dihidupkan ulang untuk menerapkan beberapa tambalan itu. Setiap server yang terpapar ke jaringan publik perlu ditambal.
railmeat
Saya punya beberapa pengontrol domain NT 4 yang bisa di-boot sekitar setahun sekali. Tidak ada lagi pembaruan dan tidak ditargetkan oleh orang jahat lagi ... (mereka tidak menghadapi internet)
hsmiths