Prosesor modern terdiri dari milyaran transistor dan teknologi produksi baru sering mengalami masalah dengan hasil, setidaknya di bulan-bulan pertama, tapi saya kira bahkan setelah bertahun-tahun akan ada chip yang rusak setiap saat.
Saya tahu bahwa dalam blok besar (misalnya cache) ada kemungkinan untuk hanya menonaktifkan bagian-bagian itu dan dengan itu mengurangi jumlah memori yang tersedia (sehingga Anda setidaknya dapat menjual chip dengan harga yang lebih rendah daripada membuangnya). Tetapi apakah ada sesuatu yang serupa untuk unit logika? Saya sadar bahwa ada beberapa ALU untuk pembubaran, tetapi apakah ini hal yang hanya menonaktifkan salah satu dari mereka jika ada kesalahan produksi? Atau apakah ada ALU cadangan tambahan? Karena bagi saya sulit untuk percaya bahwa fab hanya membuang setiap chip di mana ada transistor yang salah di bagian logika, sementara menonaktifkan ALU lengkap akan dengan benar mengurangi kekuatan pemrosesan yang dapat dicapai secara signifikan.
sumber
Jawaban:
Seperti yang dikatakan orang lain, sulit untuk melihat logika ALU yang berlebihan dalam sebuah inti.
Inti dirancang untuk mengoptimalkan throughput. Logika tambahan apa pun untuk ALU yang berlebihan akan berdampak pada kinerja dan peningkatan area akan memperlambat keseluruhan inti. Seiring perkembangan teknologi, silikon menjadi lebih kecil, membuat inti lebih cepat, tetapi pada dasarnya menggunakan properti intelektual yang sama. Mengapa ALU redundan, ketika ruang tersedia untuk core redundan untuk meningkatkan hasil produksi?
Pada 2011, Intel mengajukan paten untuk setidaknya 32 core dengan 16 core aktif dan 16 cadangan. Status paten inti yang gagal akan memiliki suhu lebih tinggi yang memungkinkan inti cadangan untuk diaktifkan. Pada dasarnya, alokasi inti dinamis sesuai kebutuhan.
Anda dapat mengalokasikan core berdaya tinggi dan berdaya rendah seperti yang dipersyaratkan oleh tugas. Atau alihkan inti buruk yang terdeteksi oleh tingkat suhu yang lebih tinggi. Operasikan inti dengan cara kotak-kotak untuk mengurangi panas.
Intel Patent: Meningkatkan Keandalan Prosesor Banyak-Inti
sumber
Tidak dalam logika.
Namun jika ada memori besar (SRAM), biasanya menggunakan memori dengan 'redundansi'. Ini memiliki logika khusus yang dapat diprogram untuk menggantikan area, seringkali sejumlah baris atau kolom.
Area gagal terdeteksi selama pengujian dan kemudian memori yang berlebihan diprogram untuk mengganti lokasi yang salah.
Namun 'penggantian' ini harus diatur menggunakan bit OTP (One-Time-Programmable) atau memori lain yang menyimpan nilainya. Jadi, memori ini hanya digunakan dalam chip yang memiliki fitur 'memori permanen', atau fitur pemrograman seperti itu harus ditambahkan juga, dengan semua biaya yang dikeluarkan.
sumber
Ini tentu bukan kasus untuk MCU sederhana, atau prosesor inti tunggal yang khas. Biaya memiliki blok cadangan tidak akan sepadan, dan prosesor-prosesor itu tidak menggunakan proses pengerjaan mutakhir, dan tidak memerlukan area silikon yang besar, sehingga hasilnya cukup baik.
Namun, ini dilakukan untuk beberapa prosesor multi-core, yang area silikonnya agak besar, dan yang menggunakan proses ukiran yang lebih baik yang dapat menyebabkan tingkat cacat yang lebih tinggi. Pada prosesor ini, seluruh inti dapat dinonaktifkan (yang merupakan blok logika agak besar, mengandung lebih dari ALU) ketika mereka rusak. Prosesor ini kemudian dijual sebagai model kelas bawah.
Sumber: /skeptics/15704/are-low-spec-computer-parts-just-faulty-high-spec-computer-parts
sumber
Saya pasti tidak bisa menjawab pertanyaan Anda dengan pasti. Tidak masuk akal untuk menonaktifkan unit yang lebih kecil dari 1 inti, karena itu menjadi "set fitur" yang sangat halus yang dapat diaktifkan atau tidak, dan produk Cartesian dari semua fitur yang mungkin akan membuat segudang model CPU yang mungkin. Sudah banyak model CPU, membuatnya 10-100 kali lebih banyak pasti tidak akan membantu!
Aspek lain adalah bahwa miliaran transistor digunakan (sebagian besar) dalam membuat cache, dan untuk transistor yang rusak ada produsen pasti menjual CPU dengan bagian-bagian dari cache on-die mereka dinonaktifkan (mis. Lihat, AMD Thorton vs AMD Barton).
Tetapi saya dapat memberi tahu Anda sebuah anekdot yang saya dengar dari orang yang saya percayai. Dahulu kala saya adalah seorang overclocker yang penasaran. Di masa saya, pilihan CPU yang bisa di-overclock adalah AMD Athlon Thoroughbred:
Saat memasang solusi pendingin khusus, seseorang harus sangat berhati-hati saat memasang heatsink, karena menekan langsung pada die. Jika Anda menerapkan tekanan yang tidak rata, cetakan tersebut terkenal mudah retak di sudut-sudut, jika Anda menerapkan gaya di satu sudut terlebih dahulu.
Orang ini telah melakukan hal yang persis sama, sebagian besar sudut hilang, tetapi CPU secara ajaib bekerja dengan baik, meskipun pada kinerja memori yang jauh berkurang. Pojok hanya berisi L2 cache, jadi dengan bagian itu hilang, protokol caching entah bagaimana bekerja di sekitar mati sekarang sangat rusak. Itu mungkin melaporkan kesalahan cache untuk semua pertanyaan di bagian itu, jadi CPU dikurangi menjadi hanya cache L1 (atau hanya bagian dari L2), jadi itu jauh lebih lambat di sebagian besar tes, namun memiliki kinerja yang hampir sama pada loop ketat.
Dalam garis pemikiran yang sama, dapat dibuat bahwa jika ALU rusak dan mampu memberi sinyal kembali entah bagaimana ia menolak bekerja, CPU mungkin dapat mundur pada ALU lain. Apakah ini dilakukan oleh produsen CPU tidak diketahui (dan saya ragu), tetapi contoh cache (dari 15 tahun yang lalu) menunjukkan bahwa itu pasti bisa dilakukan.
sumber