Tes RAM tidak konsisten - apa penyebab yang paling mungkin? (yaitu, apa yang harus saya keluarkan untuk mengganti)

20
  • Motherboard: GA-B85M-DS3H-A
  • CPU: Core i5 4430
  • RAM: PNY XLR8 DDR3 32GB (4x8GB) 1600MHz (MD32768K4D3-1600-X9)
  • PSU: EVGA 500 W1 80+

Masalah

Dengan semua 32GB RAM terpasang, sistem gagal MemTest86 + 6.2 secara konsisten. Kegagalan selalu terjadi selama pass pertama, dan kesalahan dengan cepat naik ke jutaan kesalahan. Mencoba untuk menjalankan hasil Windows dalam reboot acak dan Berhenti kesalahan (seperti yang diharapkan dengan kesalahan RAM).

Apa yang saya coba

  • Tes modul 8GB PNY tunggal dalam soket DIMM1. Berhasil menyelesaikan 4 pass MemTest.
  • Tes modul 8GB PNY tunggal dalam soket DIMM2. Berhasil menyelesaikan 4 pass MemTest.
  • Tes modul 8GB PNY tunggal dalam soket DIMM3. Berhasil menyelesaikan 4 pass MemTest.
  • Tes modul 8GB PNY tunggal dalam soket DIMM4. Berhasil menyelesaikan 4 pass MemTest.
  • Uji keempat DIMM 8 GB PNY secara terpisah, secara terpisah, dalam soket DIMM1. Semua modul berhasil menyelesaikan 4 pass dari MemTest.
  • Uji dua modul PNY 8GB dalam soket DIMM1 dan DIMM2. Berhasil menyelesaikan 4 pass MemTest.
  • Uji dua modul PNY 8GB dalam soket DIMM3 dan DIMM4. Berhasil menyelesaikan 4 pass MemTest.
  • Uji motherboard dengan empat DIMM 2GB yang dikenal baik di semua soket. Berhasil menyelesaikan 4 pass MemTest.
  • Tukar urutan PNY DIMM di soket. Tidak ada perubahan - Kesalahan MemTest masih terjadi.
  • Naikkan tegangan RAM motherboard dari 1.5V ke 1.65V. Tidak ada perubahan - Kesalahan MemTest masih terjadi.
  • Bermain dengan berbagai kombinasi pengaturan manual RAM dalam utilitas pengaturan - mengaktifkan / menonaktifkan profil XMP, mengatur preset "peningkatan stabilitas", dll. Tidak ada perubahan, kesalahan MemTest masih terjadi.

Saya pikir saya dapat dengan aman mengesampingkan RAM buruk dan soket RAM buruk. Satu- satunya saat tes MemTest gagal adalah jika keempat modul 8GB dipasang secara bersamaan.

Saya telah mengukur tegangan yang keluar dari PSU dan semua yang ada di sana tampak stabil bahkan dengan keempat batang terpasang.

Ketika saya menulis ini, saya telah mencoba pilihan terakhir untuk secara manual mengurangi kecepatan RAM menjadi 1066MHz di BIOS. Sejauh ini, MemTest telah menyelesaikan satu operan dan sudah lulus kedua tanpa kesalahan. (Semua tes di atas dilakukan pada kecepatan RAM 1600MHz asli.) Ini memungkinkan saya untuk menggunakan sistem, meskipun dengan kecepatan RAM yang sedikit lebih lambat, tetapi ini sepertinya bukan perbaikan permanen.

Setiap kali kesalahan MemTest terjadi, mereka selalu terjadi pada posisi yang persis sama pada bus alamat 64-bit:

Bit Error Mask: 00000000FF000000

Selain itu, kesalahan TIDAK PERNAH terjadi di bawah penghalang 4GB. Dengan kata lain, semua kesalahan terjadi di ruang alamat antara 4GB dan 32GB.

Saya menyimpulkan ini menjadi semacam interaksi aneh atau masalah waktu dengan CPU dan RAM dan motherboard, karena kesalahannya sangat konsisten, hanya terjadi dalam satu konfigurasi tertentu, tampaknya dimitigasi dengan memperlambat RAM, dan hanya terjadi di atas penghalang 4GB. Pertanyaan saya adalah: Apakah lebih besar kemungkinan CPU atau motherboard saya penyebabnya?

Saya telah berniat untuk memutakhirkan mesin ini ke Core i7-4790K, jadi jika CPU kemungkinan penyebabnya (saya tahu bahwa pengontrol memori menggunakan CPU pada model-model baru ini) maka itu bekerja dengan baik karena saya berencana untuk meningkatkan itu sih, tapi saya bertanya-tanya apakah ada kemungkinan bahwa motherboard itu sendiri mungkin juga menjadi bagian dari masalah. yaitu saya tidak ingin menghabiskan uang pada CPU i7 hanya untuk mengalami masalah yang sama persis dan mencari tahu saya juga harus mengganti motherboard ...

Nasihat?


EDIT: Kecepatan RAM yang lebih lambat masih menghasilkan kesalahan, tetapi hanya sekali tes mencapai pass ketiga. Saya memulai kembali tes dengan hanya satu CPU yang aktif hanya untuk menguji interaksi pada CPU itu sendiri.

fdmillion
sumber
Satu-satunya cara untuk mengkonfirmasi apakah itu memori, mobo atau cpu adalah dengan menguji ram di sistem lain yang kompatibel.
Moab
2
Jika masalah tidak bergerak ketika Anda memindahkan chip RAM, motherboard adalah tosser.
Joshua
1
Ketika Anda menjalankan memori ini dalam dua, atau ketika Anda memiliki 4 (8g) modul, Anda mungkin bisa melepasnya dari SPD (otomatis) dan mengubah pengaturan waktunya sedikit dan membuatnya berfungsi. katakan itu 10,11,10,24 tune ke 11,12,11,32 dan tes seperti itu sebagai gantinya. (Ya ini menebak) Jika itu bekerja 100% non-stop, maka itu cenderung menjadi masalah panas atau masalah motherboard. Orang-orang dengan modul 4x8gig memiliki masalah yang Anda gambarkan sebelumnya, jika ada dukungan pengaturan tegangan, dan cpu tidak memiliki pin bengkok, itu bisa menjadi cara untuk membuat barang tidak ada dalam daftar kompatibilitas untuk bekerja. jadi uji itu dan kembali ke kami.
Psycogeek
2
"Kecepatan RAM yang lebih lambat masih menghasilkan kesalahan, tetapi hanya sekali tes mencapai pass ketiga" Selama ini, apakah Anda mengambil langkah ekstra untuk menguji pendinginan ram? Bahkan kipas tambahan sementara atau kipas eksternal yang menggerakkan udara melintasi ram dan hal-hal pengaturan tegangan kurcuitnya, dapat menguji apakah panas merupakan salah satu masalah.
Psycogeek
@Psycogeek +1 untuk menyarankan modifikasi waktu. Beberapa modul RAM tidak bermain bagus dengan yang lain sejauh timing (bahkan merek atau jenis modul yang sama). Saya memiliki masalah yang mirip dengan OP dan diselesaikan dengan mengatur timing secara manual.
Amziraro

Jawaban:

18

Ini tidak terdengar seperti komponen mana pun rusak, melainkan Anda menggunakan kombinasi yang tidak kompatibel.

Memiliki beberapa soket pada bus memori yang sama akan meningkatkan kapasitansi pada setiap jalur data dan memperlambat waktu naik, yang dapat menyebabkan transisi tiba terlambat dan salah dikenali. Fenomena ini dikenal oleh insinyur listrik sebagai "fan-out".

Ini lebih rumit karena internal fan-out ke modul memori. Jumlah dan topologi perangkat DRAM pada modul, yang disebut "peringkat", akan memengaruhi berapa banyak modul yang berhasil Anda sambungkan secara paralel.

Motherboard server yang mendukung banyak soket memori sebenarnya membutuhkan buffered memory, yang menggunakan jaringan buffer untuk membatasi fan-out (dan karenanya kapasitansi) yang terlihat oleh masing-masing. Ada penundaan yang disebabkan oleh buffer itu sendiri, tetapi hanya meningkat secara logaritmik dengan jumlah beban, sedangkan untuk kapasitansi memori yang tidak dikonstruksikan meningkat secara linear.

Wikipedia membahas ini: https://en.wikipedia.org/wiki/Memory_rank

Beberapa manual motherboard benar-benar memanggil hal semacam ini. Untuk yang lain, Anda dapat menyimpulkan informasi dari daftar kompatibilitas RAM. Sebagai contoh, motherboard ASUS Z170-A menunjukkan bahwa peringkat ganda (disebut DS = sisi ganda dalam manual) hanya dapat digunakan dalam dua slot sekaligus di papan itu, sebagai lawan dari kemampuan untuk menggunakan empat DIMM peringkat tunggal sekaligus. .

masukkan deskripsi gambar di sini

Ben Voigt
sumber
Dengan asumsi ini adalah penyebab masalah, apakah akan membantu untuk mematikan SPD dan menyesuaikan pengaturan waktu sedikit lebih lambat untuk mengimbangi kenaikan / penurunan yang lebih lambat?
brhans
1
Saya tidak yakin apakah ini benar atau tidak. Prosesor Consumer Haswell umumnya mendukung empat peringkat memori per saluran, yang cukup untuk memungkinkan empat modul dua sisi dalam dua saluran memori. Mengapa ini menjadi masalah? Ini juga tampaknya tidak menjelaskan fakta bahwa masalah hanya terjadi di atas penghalang 4 GB. Lebih lanjut, manual motherboard menyatakan bahwa chipset B85 yang mendasarinya mendukung memori 32 GB dan tidak menyebutkan batasan mengenai jumlah peringkat memori.
bwDraco
2
@ bbwraco: Meskipun pengontrol memori pada CPU, motherboard juga penting. Tata letak PCB dapat mempengaruhinya, pencocokan panjang suboptimal akan mengurangi margin fase pada sinyal (ini juga mengapa kesalahan berkorelasi dengan byte atau posisi bit tertentu). Bahwa manual motherboard tidak berbicara tentang peringkat tidak berarti bahwa semua kombinasi didukung, itu hanya berarti manual omong kosong yang tidak masuk ke detail.
Ben Voigt
1
@brhans: Bukan parameter waktu yang penting, tetapi frekuensi jam memori, karena masalahnya adalah dalam transfer antara CPU dan DIMM, bukan internal ke DRAM. SPD biasanya memiliki sejumlah profil yang sesuai dengan frekuensi clock yang berbeda, memilih yang berbeda dari ini akan lebih baik daripada pergi sepenuhnya manual.
Ben Voigt
1
Jelas sepertinya masalah integritas sinyal motherboard. Modul yang lebih besar bisa memiliki kapasitansi per pin yang lebih tinggi daripada modul yang lebih kecil, terutama jika modul itu sendiri peringkat ganda. Ini dapat menyebabkan masalah ini saat Anda mengisi seluruh peringkat. Dimungkinkan untuk modul memiliki lebih dari satu peringkat. Jadi empat peringkat per saluran dapat dengan mudah menjadi dua modul kepadatan tinggi dua peringkat. Ini bisa diperburuk oleh karakteristik listrik dan rute jejak pada motherboard. Saran saya: coba motherboard lain.
alex.forencich
9

Itu terdengar seperti masalah dalam pengontrol memori terintegrasi prosesor .

Dalam sistem modern, motherboard tidak benar-benar berperan dalam manajemen memori, tidak hanya menyediakan jalur antara modul memori dan prosesor. Memori terhubung langsung ke prosesor untuk meminimalkan latensi; " northbridge " yang menghubungkan memori ke prosesor pada sistem lama sekarang menjadi bagian dari prosesor itu sendiri. (Firmware atau PCH dapat mengontrol bagaimana prosesor menjalankan RAM, tetapi tidak masuk akal untuk menyebabkan kesalahan bit seperti yang Anda uraikan karena pada akhirnya merupakan tanggung jawab prosesor.) Oleh karena itu, hal pertama yang saya pikirkan d tersangka dalam situasi seperti ini adalah IMC yang salah.

Bahkan, saya akan sangat terkejut jika motherboard atau sistem firmware disalahkan atas masalah yang Anda alami.

bwDraco
sumber
Bagaimana dengan pin yang bengkok?
Michael Hampton
6
@Michael: Pin yang bengkok akan mengakibatkan kegagalan pengujian modul individual juga.
Ben Voigt
4

Saya melihat beberapa ulasan buruk untuk BIOS pada motherboard itu. Saya akan mulai dengan memeriksa pembaruan BIOS. Jangan pernah berhemat pada motherboard.

Atoadaso
sumber
BIOS terkini. Memang RAM tidak ada dalam daftar "memenuhi syarat", tetapi memiliki timing yang sama seperti banyak modul lain yang terdaftar di sana.
fdmillion
Saya akan melihat ke dalam mengganti motherboard itu. Itu tidak harus menjadi yang teratas, cukup mulai dengan kisaran harga yang Anda mampu dan cari yang dengan ulasan terbanyak (baca juga). Mereka yang memiliki basis pengguna terbesar jauh lebih mungkin memiliki dukungan jangka panjang untuk pembaruan BIOS dan chipset.
Atoadaso
Sudahkah Anda memeriksa apakah motherboard itu bahkan mampu menangani memori 32 GB sekaligus dengan benar? Anda juga dapat menemukan chip manajer memori pada motherboard dan mencari tahu berapa banyak memori yang diharapkan dapat ditangani dengan benar.
milesrf
1

Ada kemungkinan bahwa RAM bisa rusak juga, meskipun itu mungkin tidak tampak. Saya memiliki masalah baru-baru ini dengan server rumah saya yang melibatkan kecelakaan fatal dengan beberapa es teh ...

Saya melalui seluruh proses penggantian setiap bagian secara individual (2 CPU, mobo, powersupply, dan 2 bank 16 GB (2x8GB) RAM) dan semuanya teruji dengan baik ketika saya hanya menggunakan satu bank RAM dengan satu CPU (kecuali untuk 1 CPU yang dipanggang).

Tidak masalah konfigurasi mana yang saya gunakan, selalu berfungsi ketika saya memiliki satu CPU dan bank RAM (apakah itu 16GB atau 32GB RAM), tetapi ketika saya memasukkan CPU ke-2 dan membagi RAM sehingga 16GB per bank, server gagal melakukan booting.

Tidak sampai saya mengganti satu bank RAM sepenuhnya yang akhirnya boot dan berjalan dengan benar, dan telah sejak itu.

tl; dr : Seperti yang dikatakan @moab dalam komentarnya, Anda tidak akan pernah dapat memastikan sampai Anda menguji setiap komponen dalam sistem yang kompatibel.

Taegost
sumber