Mengapa tepatnya chip mulai tidak berfungsi begitu kepanasan?

26

Begitu kepanasan kepanasan, ia dapat mulai tidak berfungsi - misalnya banyak program mungkin mulai gagal setelah beberapa atau semua bagian dalam komputer kepanasan.

Apa yang sebenarnya terjadi yang membuat chip tidak berfungsi saat kepanasan?

sharptooth
sumber

Jawaban:

26

Untuk memperluas jawaban lain.

  1. Arus bocor yang lebih tinggi: ini dapat menyebabkan lebih banyak masalah pemanasan dan dapat dengan mudah menghasilkan pelarian termal.
  2. Rasio sinyal ke derau akan berkurang seiring derau termal meningkat : Ini dapat menghasilkan tingkat kesalahan bit yang lebih tinggi, ini akan menyebabkan program salah membaca dan perintah menjadi salah ditafsirkan. Ini dapat menyebabkan operasi "acak".
  3. Dopan menjadi lebih mobile dengan panas. Ketika Anda memiliki chip yang terlalu panas transistor dapat berhenti menjadi transistor. Ini tidak dapat dipulihkan.
  4. Pemanasan yang tidak merata dapat membuat struktur kristal Si rusak. Orang normal dapat mengalami dengan menempatkan gelas melalui goncangan suhu. Ini akan hancur, agak ekstrem, tetapi menggambarkan intinya. Ini tidak dapat dipulihkan.
  5. Memori ROM yang tergantung pada pelat terisolasi yang terisi akan dapat kehilangan memori saat suhu meningkat. Energi termal, jika cukup tinggi, dapat memungkinkan elektronik keluar dari konduktor yang diisi daya. Ini dapat merusak memori program. Ini secara teratur terjadi pada saya selama penyolderan IC yang sudah diprogram ketika seseorang kepanasan chip.
  6. Hilangnya kontrol transistor: Dengan energi termal yang cukup, elektron Anda dapat melompati celah pita. Semikonduktor adalah bahan yang memiliki celah pita kecil sehingga mudah dijembatani dengan dopan tetapi cukup besar sehingga suhu operasi yang diperlukan tidak mengubahnya menjadi konduktor di mana celahnya lebih kecil daripada energi termal material tersebut. Ini adalah penyederhanaan yang berlebihan dan merupakan dasar dari posting lain, tetapi saya ingin menambahkannya dan menuliskannya dengan kata-kata saya sendiri.

Ada lebih banyak alasan, tetapi ini membuat beberapa penting.

Kortuk
sumber
Tampaknya kegagalan waktu akan menjadi salah satu "alasan lebih" (resistansi kawat cenderung meningkat dengan suhu, sehingga jalur timing terbatas resistansi-kapasitansi mungkin melanggar waktu kasus terburuk yang dijamin). Tentu saja, DRAM juga membocorkan muatan (seperti memori flash) lebih cepat pada suhu yang lebih tinggi; tanpa kompensasi dalam data kecepatan refresh dapat hilang.
Paul A. Clayton
13

Masalah utama dengan operasi IC pada suhu tinggi adalah meningkatnya arus bocor dari masing-masing transistor. Arus bocor dapat meningkat sedemikian rupa sehingga tingkat tegangan switching perangkat terpengaruh, sehingga sinyal tidak dapat merambat dengan baik di dalam chip, dan berhenti berfungsi. Mereka biasanya pulih ketika dibiarkan dingin, tetapi itu tidak selalu terjadi.

Proses pembuatan untuk operasi suhu tinggi (hingga 300C) menggunakan teknologi CMOS silicon-on-insulator karena kebocoran rendah pada rentang suhu yang sangat luas.

Leon Heller
sumber
9

Hanya satu tambahan untuk beberapa jawaban yang sangat baik: Secara teknis bukan dopan yang mendapatkan lebih banyak ponsel, melainkan peningkatan konsentrasi pembawa intrinsik. Kalau pun dopan / pembawa kurang bergerak karena kisi kristal silikon mulai "bergetar" karena meningkatnya energi termal sehingga elektron dan lubang lebih sulit mengalir melalui perangkat - hamburan fonon optik Saya percaya phsyics menyebutnya tetapi saya mungkin salah

Ketika konsentrasi pembawa intrinsik meningkat melampaui tingkat doping Anda kehilangan kontrol listrik perangkat. Operator intrinsik adalah yang ada sebelum kita menggunakan silikon, ide semikonduktor adalah bahwa kita menambahkan operator kita sendiri untuk menghasilkan sambungan pn dan hal-hal menarik lainnya yang dilakukan transistor. Silikon menduduki peringkat teratas sekitar 150degC sehingga RF heat sinking dan prosesor kecepatan tinggi sangat penting karena 150degC tidak terlalu sulit dicapai dalam praktiknya. Ada hubungan langsung antara konsentrasi pembawa intrinsik dan arus kebocoran dari perangkat.

Seperti yang telah ditunjukkan oleh bab-bab lain, ini hanyalah salah satu alasan chip gagal - bahkan dapat mencapai sesuatu yang sederhana seperti ikatan kawat yang terlalu panas dan melepaskan padnya, ada banyak hal.

SimonBarker
sumber
Ketika saya mengatakan bahwa dopan menjadi lebih mobile, maksud saya atom fisik, bukan pembawa. Persimpangan PN dapat melayang dan berhenti menjadi dioda dengan waktu dan panas. Kedua, Ketika Anda mendapatkan suhu yang cukup tinggi energi termal Anda, yang menciptakan fonon energi tinggi yang berinteraksi dengan elektron dan tingkat IR yang jauh lebih tinggi di dalam struktur, dapat memberikan elektron energi yang cukup tinggi untuk melompati celah-pita antara lapisan konduksi dan valensi . Si bertengger keluar karena celah pita sedemikian rupa sehingga 150degC akan memberikan elektron kemampuan untuk melompat.
Kortuk
Ya, saya pikir kita mengatakan hal yang sama hanya dari titik awal yang berbeda.
SimonBarker
1
Cara Anda menjelaskannya terdengar persis seperti yang saya lakukan setelah mengambil fisika perangkat, setelah mengambil beberapa perangkat Quantum dan solid state yang saya terapkan, saya mengatakannya sedikit berbeda, tetapi kita berdua tahu betapa terlalu disederhanakan penjelasan ini. Saya menambahkan sedikit tentang pengaruh ini pada jawaban saya karena saya pikir ini sangat penting, saya memberi Anda +1 pertama Anda, yang pantas Anda dapatkan. Ini adalah pengaruh penting karena menyebabkan pelarian termal sangat cepat.
Kortuk
8

Meskipun arus kebocoran meningkat, saya berharap masalah yang lebih besar untuk banyak perangkat berbasis MOS adalah bahwa jumlah arus yang melewati transistor MOS dalam keadaan "on" akan berkurang karena perangkat menjadi panas. Agar suatu perangkat dapat beroperasi dengan benar, transistor yang mengalihkan sebuah simpul harus dapat mengisi atau melepaskan kapasitansi laten di bagian sirkuit tersebut sebelum hal lain bergantung pada simpul yang telah diaktifkan. Mengurangi kemampuan transistor yang lewat saat ini akan mengurangi laju di mana mereka dapat mengisi atau melepaskan node. Jika sebuah transistor tidak dapat mengisi atau mengeluarkan sebuah node secara memadai sebelum bagian lain dari sirkuit bergantung pada node yang telah diaktifkan, sirkuit tersebut akan mengalami kegagalan fungsi.

Perhatikan bahwa untuk perangkat NMOS, ada trade-off desain ketika mengukur transistor pull-up pasif; semakin besar pull-up pasif, semakin cepat node dapat beralih dari rendah ke tinggi, tetapi semakin banyak daya yang terbuang setiap kali node rendah. Oleh karena itu banyak perangkat semacam itu yang dioperasikan agak di dekat tepi operasi yang benar dan kegagalan fungsi berbasis panas (dan untuk elektronik vintage, tetap) cukup umum. Untuk elektronik CMOS pada umumnya, masalah seperti itu umumnya kurang parah; Dalam praktiknya saya tidak tahu sejauh mana mereka berperan dalam hal-hal seperti prosesor multi-GHZ.

supercat
sumber
2
Ini adalah efek yang sangat penting, saya baru saja akan meminta Kortuk untuk menambahkannya ke jawabannya. Salah satu faktor di balik spesifikasi Tj maksimum untuk prosesor adalah bahwa di atas Tj prosesor mungkin tidak bekerja pada kecepatan pengenal. Ini juga mengapa pendinginan yang lebih baik membantu dalam overclocking.
Andy
Paragraf pertama adalah mengapa komputer Anda berhenti bekerja saat panas - komputer melambat terlalu banyak untuk mengimbangi frekuensi jam.
W5VO
Sebenarnya, ada faktor lain yang mungkin memainkan peran dalam perangkat NMOS, meskipun saya tidak akan mengharapkannya dalam desain yang paling khas: banyak perangkat NMOS memiliki kecepatan clock minimum , yang diberlakukan oleh persyaratan untuk menggunakan atau menyegarkan data dalam node penyimpanan dinamis sebelum kehabisan karena kebocoran. Jika arus bocor meningkat dengan suhu, kecepatan clock minimum juga akan meningkat. Saya menduga sebagian besar perangkat dioperasikan cukup di atas kecepatan clock minimum sehingga peningkatan kecepatan minimum tidak akan menjadi masalah, tapi saya tidak yakin.
supercat
@Andy, @ W5VO, saya menulis jawaban saya tadi malam dan lupa di tengah jalan. Pergeseran malam tidak merusak otak Anda.
Kortuk
2

Untuk melengkapi jawaban yang ada, sirkuit hari ini peka terhadap dua efek penuaan berikut (tidak hanya ini tetapi mereka yang utama pada proses <150nm):

Karena suhu meningkatkan mobilitas operator, ini meningkatkan efek HCI dan NBTI, tetapi suhu bukanlah penyebab utama untuk NBTI dan HCI:

  • HCI disebabkan oleh frekuensi tinggi
  • NBTI dengan tegangan tinggi

Dua efek penuaan silikon ini menyebabkan kerusakan reversibel dan ireversibel pada transistor (dengan mempengaruhi / memburuk substrat isolator) yang meningkatkan ambang tegangan transistor (Vt). Akibatnya bagian akan memerlukan tegangan yang lebih tinggi untuk mempertahankan tingkat kinerja yang sama, yang menyiratkan peningkatan suhu operasi dan, seperti dikatakan dalam posting lain, peningkatan kebocoran gerbang transistor akan mengikuti.

Untuk meringkas, suhu tidak akan benar-benar membuat bagian umur lebih cepat, itu adalah frekuensi dan tegangan yang lebih tinggi (yaitu overclocking) yang akan membuat bagian umur Tetapi penuaan transistor membutuhkan tegangan operasi yang lebih tinggi yang membuat bagian lebih panas.

Konsekuensi: konsekuensi dari overclocking adalah peningkatan suhu dan tegangan yang diperlukan.

Eric
sumber
1

Alasan umum IC gagal gagal ireversibel adalah karena logam Aluminium di dalamnya yang digunakan untuk membuat interkoneksi antara berbagai elemen meleleh dan membuka atau perangkat pendek.

Ya, arus bocor akan meningkat, tetapi umumnya bukan kebocoran arus itu sendiri yang menjadi masalah, tetapi panas yang ditimbulkannya, dan akibatnya kerusakan pada logam di dalam IC.

Sirkuit daya (mis. Catu daya, driver arus tinggi, dll.) Dapat rusak karena pada tegangan tinggi, ketika driver transistor mati dengan cepat, arus internal dihasilkan yang menyebabkan pemasangan perangkat, atau distribusi daya yang tidak merata di dalamnya yang menyebabkan lokal pemanasan dan kegagalan logam selanjutnya.

Sejumlah besar (1000-an) siklus termal berulang dapat menyebabkan kegagalan karena ketidakcocokan antara ekspansi mekanis IC dan paket, akhirnya menyebabkan kabel ikatan dicabut atau dibatasi bahan kemasan plastik dan kegagalan mekanis berikutnya.

Tentu saja sejumlah besar spesifikasi parametrik IC hanya ditentukan pada kisaran suhu tertentu, dan ini mungkin tidak dalam spesifikasi di luar ini. Tergantung pada desain, ini dapat menyebabkan kegagalan, atau pergeseran parametrik yang tidak dapat diterima (ketika IC berada di luar kisaran suhu) - ini dapat terjadi untuk suhu yang sangat tinggi atau rendah.

jp314
sumber
Aluminium meleleh pada 660 ° C (1220 ° F). IC mati jauh sebelum suhu ini tercapai.
Dmitry Grigoryev
Pada dasarnya tidak. Pada suhu di bawah ini, Anda tentu bisa mendapatkan perilaku listrik yang tidak diinginkan; pemanasan berlebihan dan pelarian termal, tetapi ini tidak benar-benar menyebabkan kegagalan permanen sampai beberapa bagian dari sirkuit mencapai suhu di mana Al (atau logam lain) berdifusi ke dalam silikon. Ini (titik eutektik) sekitar 500-600 C. Sebagian besar kegagalan lain dapat dipulihkan. Kegagalan tambahan dapat disebabkan oleh kegagalan fungsi listrik yang memungkinkan tegangan berlebih untuk diterapkan pada gerbang transistor atau siklus termal (yang menyebabkan kegagalan mekanis).
jp314
Saya masih ragu. Sebagai contoh, IC biasanya menentukan suhu maksimum penyolderan sekitar 300 ° C, sehingga tampaknya melampaui batas itu sudah cukup untuk menyebabkan kerusakan permanen.
Dmitry Grigoryev