Pertama:
MTTF = Mean Time To Failure
MTTR = Mean Time To Repair
MTBF = Mean Time Between Failures = MTTF + MTTR
MTBF sering kurang lebih sama dengan MTTF, karena perbaikan mungkin memakan waktu satu jam, dan MTTF mungkin puluhan ribu jam. Tetapi juga MTBF sering tidak berlaku, karena produk yang rusak tidak diperbaiki, tetapi diganti saja, karena biaya perbaikan lebih dari penggantian.
Penghitungan MTTF adalah metode statistik kompleks yang melibatkan penghitungan peluang kegagalan setiap bagian. Dan itu bukan hal yang linier seperti yang terkadang disangka orang. Jika Anda memiliki MTTF 1.000.000 jam, itu tidak berarti bahwa dalam 1.000 perangkat akan ada satu kegagalan setelah 1000 jam, atau bahwa Anda akan mengalami kegagalan pada 1.000.000 perangkat setelah 1 jam.
Banyak perangkat elektronik mengikuti "kurva bak mandi" ,
di mana ada banyak kegagalan sejak awal, maka waktu yang lama dengan hampir tidak ada kegagalan, dan menjelang akhir hidup jumlah kegagalan meningkat lagi. Dalam hard disk ada juga beberapa bagian mekanis yang memiliki kurva kegagalan yang lebih linier; ini perlahan-lahan landai dari hari 1.
Jika pabrikan mengatakan misalnya 1.000.000 jam MTTF (itu paling sering POH, atau Power-On Hours) itu berarti bahwa rata - rata drive harus bertahan> 100 tahun. Beberapa drive akan bertahan lebih lama, beberapa akan gagal sebelumnya. Jadi meskipun 1000 000 jam itu sangat mungkin untuk mengalami kegagalan setelah 1000 jam. Saya pernah mengalami kegagalan drive dalam waktu seminggu, dan kemudian Anda harus memikirkan kembali kurva bak mandi. Drive pengganti telah berputar dengan gembira selama> 50k jam.
Jika sebuah peralatan memiliki MTBF penggunaan 1.000.000 jam, itu tidak berarti bahwa setiap peralatan dapat diharapkan berlangsung 1.000.000 jam. Sebaliknya, itu berarti, secara umum, bahwa jika 1.000.000 peralatan yang berada dalam masa kerja pengenalnya masing-masing dioperasikan selama satu jam, atau 100.000 buah dioperasikan selama sepuluh jam (tetapi masih dalam masa pengenal), atau 60.000.000 untuk satu menit, dll. kira-kira akan ada satu kegagalan di tempat parkir. Perhatikan bahwa layanan seumur hidup dinilai sepenuhnya orthogonal untuk MTBF. Pertimbangkan dua jenis widget berikut:
Jenis widget pertama memiliki masa hidup rata-rata sekitar 1.000 jam, dan juga memiliki MTBF sekitar 1.000 jam. Yang kedua akan memiliki masa hidup rata-rata 61 menit, tetapi MTBF 1.000.000.000 jam dalam masa layanannya. Meskipun mungkin aneh untuk mengatakan bahwa perangkat kedua memiliki MTBF yang hampir miliar kali selama masa hidup yang diharapkan, MTBF bukanlah angka yang tidak berarti.
Misalkan seseorang akan melakukan percobaan yang mengharuskan 1.000.000 perangkat bekerja dengan sempurna selama satu jam, setelah itu semuanya akan dihapus. Jika ada perangkat yang gagal, seluruh percobaan akan hancur. Yang akan lebih berguna - perangkat yang akan bertahan rata-rata 1.000 jam tetapi memiliki MTBF hanya 1.000 jam, atau perangkat yang akan bertahan paling lama 61 menit, tetapi hanya akan memiliki satu dalam satu miliar peluang gagal untuk memenuhi tanda itu?
sumber
Menambah jawaban stevenvh: Produsen disk terkenal semua melakukan burn-in run perangkat baru, seperti halnya produsen komponen elektronik. Dalam hard disk, tidak hanya MTBF dan MTTF keseluruhan tetapi juga statistik kegagalan individu untuk blok disk. Dengan kata lain: Beberapa bagian dari pemintalan, "piring" dalam disk mungkin gagal, sementara sebagian besar masih membaca / menulis ok. Yang disebut "bad sector" dapat dideteksi dan kemudian dipetakan oleh firmware di dalam drive.
Semua drive saat ini berisi sektor tambahan sebagai cadangan yang kemudian dapat digunakan sebagai pengganti sektor yang rusak. Ini hanyalah tindakan pencegahan oleh pabrikan: Jika mereka tidak melakukan ini, mereka tidak dapat menjual disk pada kapasitas yang diumumkan. Jika mereka membangun x% tambahan dari sektor tersembunyi sebagai cadangan, mereka meningkatkan biaya sebesar <x% tetapi mencapai hasil produksi keseluruhan yang jauh lebih tinggi.
Disk hari ini menyimpan hitungan bad sector yang juga dapat dibaca dengan perangkat lunak yang sesuai. Ini dan parameter kesehatan disk lainnya (misalnya suhu) disebut nilai SMART .
Sekarang, begitu pabrikan telah melakukan tes burn-in drive, dan beberapa sektor hampir mengalami kegagalan dan telah dipetakan kembali oleh firmware internal drive, parameter SMART "Bad Sector Count" parameter diatur ke 0. Kemudian drive dikirimkan ke pelanggan.
Biasanya, setelah proses pembakaran, awal kurva bathtub yang telah disebutkan tidak lagi terlihat oleh pelanggan. Kami beruntung, dan hanya melihat peningkatan kemungkinan kegagalan seiring waktu.
Jadi jika Anda melihat MTTF yang dikutip oleh pabrikan, untuk setiap pemodelan kegagalan yang mungkin ingin Anda lakukan, Anda dapat mengabaikan awal dari kurva bathtub.
sumber
Anda harus menafsirkan ini sebagai pemasaran. Mereka sebenarnya tidak tahu persis MTBF (Rata-rata waktu antara kegagalan), jadi mereka menggunakan berbagai trik untuk memperkirakannya, dan mereka menunjukkan angka yang lebih tinggi untuk drive 'perusahaan' untuk membenarkan biaya mereka.
Pada kenyataannya, itu menguntungkan bagi produsen HDD untuk memiliki HDD mereka gagal segera setelah garansi berakhir.
Sebagai teori konspirasi, saya percaya kegagalan massal Seagate 7200.11 adalah kesalahan dalam menerapkan 'kematian terprogram' yang menyebabkan disk gagal sebelum garansi berakhir, sehingga mereka harus 'memperbaikinya' dengan pembaruan firmware.
sumber