Apa yang dapat menyebabkan kartu grafis PCIe gagal secara acak saat boot?

1

Saya memiliki sistem yang saat ini membuat saya gila, dan saya berharap seseorang di sini di StackExchange akan dapat menunjukkan sesuatu yang saya lakukan salah.

Komputer ini buatan sendiri dan terdiri dari:

  • CPU: Intel Core i7 4790K (stok @ 4GHz)
  • MB: Gigabyte GA-Z97X-Gaming G1 WIFI-BK
  • RAM: G. skill Trident X F3-2400C10Q-32GTX (kit yang sesuai 8GBx4)
  • GFX: 2x Gigabyte GV-N980G1 GAMING-4GD GTX 980 (SLI)
  • PWR: Corsair HX1000i
  • OS: Windows 8.1 Pro

Setiap kali saya menghidupkan mesin, itu adalah koin-melemparkan apakah kartu grafis akan online atau tidak. Jika saya beruntung, kartunya menyala dan saya mendapatkan sinyal tampilan (melalui DP-out) ke monitor utama saya. Ketika ini terjadi, mesin tampaknya beroperasi dengan benar sampai daya bersepeda, meskipun kinerjanya jauh di bawah di mana seharusnya untuk perangkat keras (skor 3DMark Fire Strike Extreme sekitar 8000, dibandingkan dengan Futuremark yang terdaftar 10100 untuk sistem referensi dengan CPU yang identik dan kartu grafis).

Jika saya kurang beruntung, mesin melakukan booting dan video online dengan grafis Intel terintegrasi (yang telah saya arahkan ke monitor kedua). Pengelola perangkat sama sekali tidak mendeteksi kartu NVIDIA. Mereka tidak muncul sebagai "perangkat tidak dikenal", mereka tidak muncul sebagai "startup gagal" - mereka hanya hilang sepenuhnya.

Mengikuti prosedur biasa untuk situasi seperti ini, saya telah melepas dan memasang kembali motherboard, kartu, catu daya dan semua koneksi daya. Saya telah memeriksa untuk memastikan bahwa tidak ada konduktor longgar yang mungkin menyebabkan celana pendek. Saya telah memeriksa suhu CPU dan GPU untuk memastikan bahwa mereka berjalan dengan baik di dalam batas termal di bawah beban (sekitar 65C untuk GPU dan 55C untuk CPU).

Saya benar-benar bingung dengan ini. Setiap saran (tidak peduli seberapa jelas) akan sangat dihargai.

Diperbarui:

Atas permintaan Journeyman Geek dalam komentar, saya telah menjalankan tes pada mesin dengan masing-masing kartu grafis dipasang secara terpisah. Ini sepertinya menyelesaikan masalah: Saya telah mem-boot sistem sekitar selusin kali dengan masing-masing kartu dan itu belum gagal muncul. Selain itu, 3DMark mengkonfirmasi bahwa kartu-kartu tersebut berperforma individual rata-rata untuk konfigurasi perangkat keras ini dengan satu GPU.

Jadi masalah ini tampaknya secara khusus terkait dengan menggunakan dua kartu dalam konfigurasi SLI.

Saat ini saya sedang melakukan beberapa tes lagi dengan dua kartu dalam konfigurasi slot PCIe yang berbeda (1 & 2 bukannya 1 & 3) untuk melihat apakah mungkin saya punya slot yang buruk di papan tulis.

Pembaruan 2:

Konfigurasi Slot 1 & 2 bekerja dengan baik dan menggunakan 9600 pada 3DMark Fire Strike Extreme. (Rendah, tapi itu diharapkan dengan dua kartu lebar-ganda berdampingan; mereka akan menjadi terlalu panas dan secara panas saling mencekik tanpa adanya cairan tugas berat atau sistem perubahan fasa di tempat.)

Setelah menjalankan beberapa tes dalam konfigurasi ini, saya mengembalikan kartu ke 1 & 3. Sekarang semuanya bekerja dengan benar di selusin sepatu bot lain. Sistem sekarang bangku 10800 di FSE.

Saya tidak bisa seumur hidup mencari tahu apa yang mungkin berbeda kali ini dibandingkan dengan setengah lusin kali saya mengulangi kartu sebelumnya. Akan tetap menjalankan konfigurasi ini selama beberapa hari dan menutup pertanyaan saya sebagai "disebabkan oleh goblin" jika saya tidak dapat mereproduksi kondisi kesalahan lagi.

Dan Story
sumber
Saya ingin tahu apakah Anda memiliki daya yang cukup, tetapi saya menganggap pasokan 1KW yang berkualitas seharusnya cukup. Apakah satu kartu berfungsi dengan baik? Juga, Anda secara khusus berbicara tentang kartu video, ada kartu PCIe lain di sekitar :)
Journeyman Geek
Secara teori, TDP maksimum GPU masing-masing 165W, dan CPU 88W. (Saya tidak menyebutkan dalam pertanyaan, tetapi ada SSD dan dua HHDD dalam sistem serta pembakar Blu-ray, tidak ada yang harus mengkonsumsi banyak daya.) Dengan ukuran yang wajar, 1KW PSU harus jauh melebihi persyaratan daya sistem meskipun diasumsikan beroperasi pada efisiensi 60%.
Dan Story
Ya, saya mungkin memiliki beberapa teori lagi tetapi pengujian dengan kartu grafis tunggal adalah tempat saya memulai. Anda mungkin harus memiliki kekuatan yang cukup untuk apa yang Anda lakukan yang membuat ini sedikit lebih penasaran.
Journeyman Geek
@JourneymanGeek Pertanyaan yang diperbarui dengan hasil tes satu kartu.
Dan Story
Yah, saya bingung. Tergoda untuk mengirim jawaban, tetapi saya tidak tahu mengapa itu bekerja sekarang. Saya kira sesuatu di suatu tempat longgar, dan tes kartu tunggal memastikan Anda melakukannya dengan benar;)
Journeyman Geek

Jawaban:

0

Anda pasti memiliki komputer gaming yang gemuk, tapi saya masih akan curiga catu daya pertama - mengkonfirmasi bahwa catu daya Anda memenuhi atau melebihi watt yang disarankan pada rel 12V kemudian membandingkannya dengan apa yang harus dipenuhi oleh spesifikasi pada 980-an.

Anda menyebutkan Windows 8.1, jadi saya juga akan mengatakan lihat log Anda dan lihat apakah Anda dapat mengumpulkan informasi lebih lanjut tentang mengapa driver Anda tidak muncul.

Saya mengalami masalah ini dengan dua 980 di bulan Januari tetapi tidak mau repot-repot menyelidiki lebih lanjut karena saya memutakhirkan ke motherboard ASUS dan catu daya Thermaltake yang lebih lama dan masalahnya hilang.

ClaireW
sumber