Pada server CPU ganda, apakah normal jika satu CPU berjalan lebih panas dari yang lain?

51

Saya memiliki server Opteron ganda yang menjalankan Linux dengan libvirt untuk menampung beberapa VM. VM bekerja dengan baik dan proses server OK, tapi saya perhatikan satu CPU selalu berjalan sekitar 69C (throttles pada 70C) dan yang lainnya berjalan sekitar 15C.

Ini sepertinya tidak normal bagiku? Tidakkah seharusnya mereka berdua sedikit lebih dekat pada suhu?

Saya tidak yakin bagaimana cara mendanus lebih jauh. Mungkin tidak ada pasta termal yang cukup pada salah satu CPU?

Sunting: Motherboard adalah ASUS KGPE-D16 dan didinginkan oleh penggemar Noctua NH-U9DO ganda .

Perhatikan bahwa saya pikir suhu mungkin lebih tinggi dari ambient, daripada nilai absolut? Ketika server idle, suhu CPU turun ke 2C dan 13C. Saya menggunakan konfigurasi lmsensors dari sini

samoz
sumber
1
Apa server make / model?
ewwhite
2
Bagaimana distribusi beban CPU? mpstat -P ALL 1di linux akan membantu
Christopher Perrin
3
Kedengarannya seperti sensor suhu yang rusak
matcheek
14
15C kemungkinan besar sensor yang rusak ....
Reaces
Sepertinya sensor yang rusak atau terkalibrasi dengan buruk, jika Anda dapat mem-boot ulang server, lihat BIOS yang seharusnya menampilkan nilai yang benar.

Jawaban:

106

Masalahnya akhirnya menjadi heatsink yang kurang pas. Mungkin kurang pas bukan deskripsi yang tepat. Ternyata, Anda harus menempelkan thermal paste pada heatsink, bukan penutup plastik yang masuk ke heatsink.

masukkan deskripsi gambar di sini

Setelah melepaskan penutup plastik, CPU bagus dan keren, terima kasih semuanya!

samoz
sumber
51
+1 hanya karena itu lucu
HBruijn
9
Maksud Anda seseorang meninggalkan penutup plastik di tempatnya dan kemudian menempelkannya di atasnya dan kemudian meletakkan heatsink itu? Epik.
TomTom
4
Baaaaaahaaahaaahahahaa !!
Craig
8
Saya suka bagaimana Anda dapat melihat syarat dan ketentuan, garansi terbatas dan kebijakan pengembalian di latar belakang. :)
Lightness Races dengan Monica
6
Jika itu membuat Anda merasa tidak terlalu bodoh, (dan itu tidak akan), saya melakukan hal yang sama dengan pembuat kopi kantor baru saya. Kopi itu terlalu dingin untuk diminum dan aku mengemasnya kembali untuk kembali ke toko sebelum piringan kardus pelindung jatuh dari elemen pemanas :)
Martin James
25

Dalam pengalaman saya, adalah normal untuk komponen berpasangan dalam case berjalan pada temperatur yang berbeda, karena aliran udara tidak sama di mana-mana. Berikut adalah grafik suhu HDD dari kotak colo saya. Drive dicerminkan, sehingga beban kerjanya mendekati identik.

Munin graph dari temps HDD selama setahun terakhir

Seperti yang Anda lihat, mereka saling melacak, tetapi mereka tidak sama; mereka juga rata-rata hanya terpisah 6C. Apakah sensor Anda melaporkan suhu absolut atau suhu berlebih, perbedaan 55C pada beban tampaknya sangat salah. Jika Anda yakin datanya benar, maka mengingat perbedaan diam turun ke 10C, yang merupakan jenis perbedaan yang saya lihat karena aliran udara, saya menduga heatsink yang tidak terpasang dengan baik.

MadHatter mendukung Monica
sumber
1
Menggunakan mpstat (dari Christopher Perrin, terima kasih!) Saya mengkonfirmasi bahwa muatannya didistribusikan secara merata. Banyak hal yang tidak digunakan saat ini di + 3C dan + 20C. Saya akan mencoba mengutak-atik heatsink untuk melihat apakah itu longgar. Apakah Anda pikir itu bisa menjadi masalah pasta termal?
samoz
Itu sangat mungkin (dan lebih lagi setelah Anda mulai menggoyangkannya).
MadHatter mendukung Monica
8

Bukan itu. Kecuali Anda memiliki masalah serius dengan aliran udara. Atau salah satu pendinginnya buruk. Temperatur AKAN bervariasi - tetapi tidak sebanyak itu (70 vs 15 derajat celsius).

Mengingat betapa rendahnya 15 derajat saya akan menganggap (a) sensor Anda tidak aktif (Anda benar-benar menyimpan server di ruangan yang dingin itu?).

Saya juga akan menganggap salah satu CPU tidak berfungsi sama sekali, untuk alasan apa pun.

Perbedaan kecil itu normal. Beberapa yang lebih besar mungkin (aliran udara datang ke pikiran saya). tetapi di sini kita berbicara tentang seseorang yang DINGIN.

TomTom
sumber
2

Ini bisa berupa pendinginan atau pemuatan yang tidak rata (mengingat perbedaan tempa, situasi Anda mungkin adalah pemuatan yang tidak rata). Anda harus menggunakan sesuatu seperti prime95 untuk memuat semua core secara merata dan melihat apakah temps masih bervariasi. Jika tidak maka Anda perlu menyeimbangkan VM, periksa apakah aplikasi Anda multithreaded dan sibuk. Cara melakukannya tergantung pada perangkat lunak Anda dan beban kerja individual sehingga benar-benar di luar cakupan pertanyaan. Ingatlah bahwa tidak ada keuntungan nyata untuk melakukan ini jika Anda tidak memiliki cukup beban untuk mengeluarkan satu cpu / core, sebenarnya VM Anda mungkin sengaja menghindari menggunakan cpu kedua sehingga dapat masuk ke mode hemat daya pada multi sistem -cpu.

Jika Anda mempersempitnya menjadi pendingin. Perbedaan kecil hingga 10C bisa jadi pasta termal terlalu sedikit (atau terlalu banyak!). Perbedaan yang lebih besar menunjukkan masalah atau perbedaan yang signifikan antara pendingin cpu. Bisa jadi seseorang telah memblokir aliran udara, heatsink telah terlepas, dll.

JamesRyan
sumber
0

Saya harus setuju dengan, temp rusak. sensor, karena 15C hanya 59F !!! Kecuali jika komputer berada di pusat data yang sangat dingin, saya akan membayangkan suhu udara sekitar akan lebih tinggi dari 59F! Anda mencoba untuk menetapkan VM ke inti suhu rendah dan melihat apakah ada perubahan; jika tidak, saya akan sangat curiga sensornya rusak.

Anda mungkin juga ingin melihat output dari dmesg(pesan boot) dan melihat apakah ada sesuatu yang luar biasa di sana.

J. Simons
sumber