mendiagnosis kegagalan daya acak dan kegagalan POST

0

Saya memiliki laptop (Toshiba Satellite C650), selama setahun terakhir secara simtomatik telah mulai menampilkan beberapa perilaku kegagalan yang agak aneh, beberapa perilaku yang lebih aneh berikut:

  1. itu akan ditutup secara acak

  2. itu secara acak akan gagal POST

  3. itu secara acak akan gagal melakukan akses hdd saat booting (terjebak pada kursor yang berkedip setelah POST)

pada awalnya saya pikir ini disebabkan oleh terlalu panas tetapi bios tidak melaporkan bahwa kegagalan termal telah tersandung atau memiliki sensor membaca nilai dekat shutdown kritis, saya sudah menjalankannya pada 85C (kegagalan telah terjadi serendah 30C) tetapi menurut semua dokumentasi saya dapat menemukan itu cukup jauh di bawah shutdown kritis dan bahkan lebih jauh dari titik di mana komponen akan rusak.

Dugaan kedua adalah kegagalan catu daya terputus-putus, namun ini juga tampaknya tidak adil karena kegagalan hanya terjadi di bawah windows 7 x64 ultimate, di bawah lengkungan linux (menjalankan kernel 4.0.6 pada tulisan ini, 4.0.7 pada saat saya retur setelah ini ) itu belum terjadi dan saya selalu di-boot ke partisi itu selama berminggu-minggu, windows yang macet setelah jam, kadang-kadang hari.

Hal ketiga yang saya duga adalah modul memori yang gagal, ini berdasarkan pada pengalaman di masa lalu di mana windows akan melakukan BSoD dari modul yang gagal tetapi linux akan terus menenggak (mungkin memetakan memori buruk, mungkin pola penggunaan saya hanya berbeda sehingga tidak pernah menulis ke memori tertentu, bagaimanapun juga) tetapi 48 jam memtestx86 + per modul dan 48 lainnya dengan kedua modul membuat saya cukup yakin bahwa ini tidak terjadi.

Tebakan keempat adalah kegagalan perangkat lunak, namun saya tidak tahu apakah windows menyimpan log yang berguna untuk ini, saya juga tidak cukup tahu tentang platform untuk mendiagnosisnya.

Kesimpulan kelima adalah kegagalan pengontrol hdd tetapi tes SMART 12H melaporkan 0 kesalahan sehingga saya bisa menyimpulkan bahwa tidak demikian halnya.

Kesimpulan keenam dan terakhir adalah kegagalan perangkat keras generik, sekali lagi saya tidak sepenuhnya yakin bagaimana saya akan mendiagnosis itu atau mengapa linux dapat menampungnya di tempat yang tidak dapat dilakukan windows, saya bertaruh ini adalah salah satu opsi yang kurang mungkin.

Adapun komputer kadang-kadang tidak pernah sampai ke POST ... itu masalah lain saya tidak yakin bagaimana saya akan men-debug, kesimpulannya di sini mungkin semacam kegagalan perangkat keras.

cara mereproduksi: nyalakan kembali komputer, baik lunak atau keras itu terjadi dua kali, nampaknya dengan proabilitas 70ish selama soft dan hanya sekitar 50% untuk hard reset, tampaknya sedikit lebih mungkin ketika me-reboot dari linux (mungkin perangkat keras tidak suka linux ?), matikan sepenuhnya dan tunggu 5-10s sebelum menyalakan ini.

seperti untuk tidak memuat boot loader (khusus tidak melaporkan akses hdd sama sekali, tidak ada hdd terdengar membaca atau aktivitas lampu indikator hdd), tidak yakin bagaimana cara men-debug ini tapi saya bertaruh itu terkait dengan masalah BIOS lainnya.

solusi paling sederhana adalah dengan hanya mengganti mesin tetapi saya akan jauh lebih tertarik untuk mencari tahu apa yang menyebabkan kesalahan yang tampaknya terkait karena kedengarannya jauh lebih menyenangkan.

0x0DEDC0DE
sumber
Adakah pembaruan bios yang tersedia untuk model itu?
Moab
tidak, tidak ada pembaruan bios baru karena dihentikan; menginstal yang terakhir sekitar dua tahun yang lalu.
0x0DEDC0DE
Saya akan menjalankan tes memori, gagal memposting adalah masalah bios atau masalah memori dalam banyak kasus.
Moab
Saya sudah menjalankan tes memori, sudah keluar bersih (saya juga tidak memiliki panik kernel atau layar berhenti (bahasa sehari-hari dikenal sebagai layar biru kematian), biasanya orang akan mengharapkan kesalahan halaman di layar berhenti area nonpaged ketika di bawah windows dengan kegagalan modul memori). Lebih lanjut saya merasa tidak mungkin bahwa bios akan memutuskan untuk gagal tanpa alasan tertentu setelah lama bekerja; namun saya tidak menolak kemungkinan itu, saya tidak punya cara untuk men-debugnya.
0x0DEDC0DE