Mempertimbangkan fakta bahwa banyak sistem kelas server dilengkapi dengan RAM ECC , apakah perlu atau berguna untuk membakar DIMM memori sebelum digunakan?
Saya mengalami lingkungan di mana semua RAM server ditempatkan melalui proses burn-in / stress-tesing yang panjang. Hal ini kadang-kadang memperlambat penerapan sistem dan memengaruhi waktu tunggu perangkat keras.
Perangkat keras server utamanya adalah Supermicro , sehingga RAM bersumber dari berbagai vendor; tidak langsung dari pabrikan seperti Dell Poweredge atau HP ProLiant .
Apakah ini latihan yang bermanfaat? Dalam pengalaman masa lalu saya, saya hanya menggunakan RAM vendor di luar kotak. Bukankah tes memori POST menangkap memori DOA? Saya telah merespons kesalahan ECC jauh sebelum DIMM benar-benar gagal, karena ambang ECC biasanya menjadi pemicu penempatan garansi.
- Apakah Anda membakar RAM Anda ?
- Jika demikian, metode apa yang Anda gunakan untuk melakukan tes?
- Apakah sudah mengidentifikasi masalah sebelum penempatan?
- Apakah proses burn-in menghasilkan stabilitas platform tambahan versus tidak melakukan langkah itu?
- Apa yang Anda lakukan saat menambahkan RAM ke server yang sedang berjalan?
Tidak.
Tujuan pembakaran dalam perangkat keras adalah untuk menekankannya sampai mengkatalisasi kegagalan pada suatu komponen.
Melakukan ini dengan hard drive mekanis akan mendapatkan beberapa hasil, tetapi tidak akan banyak membantu RAM. Sifat komponen adalah sedemikian rupa sehingga faktor lingkungan dan usia jauh lebih mungkin menjadi penyebab kegagalan daripada membaca dan menulis ke RAM (bahkan pada bandwidth maksimum selama beberapa jam atau hari).
Dengan asumsi RAM Anda cukup berkualitas sehingga solder tidak akan meleleh saat pertama kali Anda benar-benar menggunakannya, proses pembakaran tidak akan membantu Anda menemukan cacat.
sumber
Kami membeli pisau dan kami biasanya membeli dalam jumlah yang cukup besar pada satu waktu, karena itu kami mendapatkannya dan memasangnya selama HARI sebelum port jaringan kami siap / aman. Jadi kami menggunakan waktu itu untuk menggunakan memtest selama sekitar 24 jam, kadang-kadang lebih lama jika melewati akhir pekan - setelah selesai, kami menyemprot ESXi dasar dan IP siap untuk profil hostnya untuk diterapkan setelah jaringan naik. Jadi ya kita mengujinya, lebih dari peluang daripada kebutuhan tetapi sudah menangkap beberapa DIA DOA sebelumnya sekarang, dan bukan saya yang melakukannya secara fisik sehingga tidak perlu usaha. Saya untuk itu.
sumber
Yah saya kira itu tergantung pada apa proses Anda. Saya SELALU menjalankan MemTest86 pada memori sebelum saya memasukkannya ke dalam sistem (server atau lainnya). Setelah Anda menjalankan dan menjalankan sistem, masalah yang disebabkan oleh memori yang salah bisa sulit untuk dipecahkan.
Adapun sebenarnya "stress-testing" memori; Saya bahkan belum melihat mengapa ini akan berguna kecuali Anda menguji untuk tujuan overclocking.
sumber
Saya tidak, tetapi saya telah melihat orang yang melakukannya. Saya tidak pernah melihat mereka mendapatkan apa pun darinya, saya pikir itu mungkin mabuk atau takhayul mungkin.
Secara pribadi, saya seperti Anda dalam hal tingkat kesalahan ECC lebih berguna bagi saya - dengan asumsi RAM bukan DOA tetapi kemudian Anda akan tahu itu.
sumber
Untuk ram non-ECC menjalankan 30 menit pada memtest86 + berguna karena biasanya tidak ada metode yang dapat diandalkan untuk mendeteksi kesalahan bit ketika sistem sedang berjalan.
Skrining biru tidak dianggap sebagai metode yang dapat diandalkan ...
Dan RAM yang sedikit terkelupas sering tidak segera muncul, hanya setelah sistem melihat beberapa memori penuh dan kemudian hanya jika data dalam RAM tersebut adalah kode yang digunakan dan kemudian jatuh. Korupsi data bisa tidak diketahui untuk waktu yang lama.
Untuk ram ECC itu tidak akan melakukan apa pun pengontrol memori itu sendiri tidak akan melakukannya sehingga benar-benar tidak masuk akal. Itu hanya buang-buang waktu saja.
Dalam pengalaman saya, orang-orang yang bersikeras membakar biasanya orang-orang tua yang selalu melakukannya seperti ini dan yang terus melakukannya karena kebiasaan tanpa benar-benar memikirkan hal-hal yang benar.
Atau mereka adalah anak muda yang mengikuti prosedur yang ditentukan yang ditulis oleh orang-orang tua itu.
sumber
Tergantung.
Jika Anda menggunakan 50.000 RAM baru, dan Anda tahu bahwa perangkat keras ini memiliki tingkat kegagalan 0,01% setelah beroperasi kurang dari sehari, secara statistik harus ada beberapa dari mereka yang akan gagal pada hari pertama. Membakar dimaksudkan untuk menangkap itu. Dengan penyebaran pada skala itu, kegagalan diharapkan, bukan situasi yang luar biasa.
Jika Anda hanya menggunakan beberapa ratusan item saja, statistik kemungkinan besar ada di pihak Anda karena Anda pasti sangat tidak beruntung mendapatkan bagian yang gagal.
sumber