Bagaimana kecepatan disk diukur dan apa yang cepat? Berapa lama waktu yang dibutuhkan untuk menyalin 1500 GB?

11

Bagaimana kecepatan disk diukur? Apakah Mbit atau Mbyte per detik dibaca? Apa yang rata-rata hari ini dan apa yang cepat dan apa yang sangat cepat di industri?

Katakanlah seseorang mengatakan perlu waktu lama untuk membuat salinan file sebesar 1500 GB (katakanlah file basis data), berapa lama waktu yang dibutuhkan untuk sistem profesional dan bagaimana hal itu dapat dihitung dengan mengambil kecepatan hard disk menjadi acount ?

hol
sumber

Jawaban:

19

Kecepatan disk biasanya diukur dalam;

  • Kecepatan rotasi dalam putaran per menit (terendah pada 4200rpm, kemudian 5400, 7200, 10k, dan 15k - ini tidak berlaku untuk SSD atau memori flash).
  • Kecepatan antarmuka adalah yang tercepat yang dapat di coba disk elektronik untuk mengirim data ke pengontrol disk (kisaran ini dari 100MBps ATA hingga 150/300/600 Mbps SATA, Fiber-Channel 2/4/8/16 Gbps dan bahkan ke kecepatan PCIe untuk penyimpanan berbasis flash seperti FusionIO).
  • Carilah waktu hanyalah waktu yang dibutuhkan untuk mulai membaca atau menulis sektor disk tertentu - ini dapat berkisar dari 3-15ms untuk disk hingga sebagian kecil untuk SSD / flash disk.
  • Kemudian kita mencapai kecepatan aktual yang dapat Anda harapkan, ada empat kecepatan yang harus Anda perhatikan; membaca berurutan (membaca blok data yang sangat besar), menulis berurutan (sama tetapi menulis), membaca acak (mendapatkan data dari seluruh disk) dan menulis acak. Ini sangat bervariasi tetapi untuk disk pemintalan Anda dapat mengharapkan apa saja dari 25MBps-to-150MBps untuk membaca dan menulis berurutan dan apa saja dari 3MBps-ke-50Mps untuk membaca dan menulis secara acak. SSD biasanya dalam kisaran 200MBps untuk berurutan dan biasanya sedikit kurang untuk operasi acak. FusionIO dapat dengan mudah mencapai 1GBps untuk semua, tetapi biasanya kecil dan mahal.

Seperti yang Anda lihat tidak ada rata-rata nyata, jika Anda ingin rekomendasi tentang apa yang harus dibeli, jangan ragu untuk kembali kepada kami dengan sebanyak mungkin informasi - ini harus termasuk anggaran, jenis aplikasi, ukuran kumpulan data, basis pengguna , perangkat keras / OS plus apa pun yang menurut Anda akan berguna.

Sedangkan untuk salinan 1,5TB Anda, nah jika Anda melakukan ini ke disk SATA 7200rpm 2-terpasang USB Anda harus mendapatkan setidaknya 30MBps-40MBps atau lebih 1.5TB penuh bisa memakan waktu lebih dari 10 jam atau lebih. Jika ini adalah sistem DAS / SAN profesional khas yang saya harapkan di wilayah 100MBps berarti itu akan memakan waktu sekitar 3 jam.

Semoga ini bisa membantu, oh dan hanya untuk menjelaskan, MB = megabita, Mb adalah megabit.

Chopper3
sumber
8

Ada banyak, banyak variabel yang terlibat dalam perhitungan semacam ini. Sistem disk dunia nyata memiliki banyak inter-dependensi. Hanya dalam satu komputer:

  • Kecepatan pengenal aktual dari drive itu sendiri (umumnya RPM, 5200, 7200, 10K, 15K)
  • Sistem file yang digunakan
  • Apakah sistem RAID sedang digunakan atau tidak
    • Jika ya, kinerja kartu RAID
    • Jenis RAID
  • Sistem Operasi sedang digunakan
  • Operasi Baca dan Tulis memiliki karakteristik kinerja yang sangat berbeda
  • Rasio baca / tulis untuk operasi
  • Untuk operasi berurutan, faktor fragmentasi penyimpanan

Seperti yang Anda lihat, kecepatan disk itu sendiri hanyalah salah satu dari banyak faktor. Ini adalah faktor yang besar, tetapi masih satu dari banyak. Jika salinan 1,5TB itu semua ada di disk yang sama, maka disk tersebut (95% kemungkinan) akan melakukan kinerja baca / tulis acak 100%, yang umumnya menghasilkan metrik kinerja terburuk. Jika salinan dari satu disk ke yang lain, dan datanya berurutan 100% dan disk target benar-benar kosong, ini akan menghasilkan kinerja tercepat yang mungkin dengan subsistem disk ini. Kinerja dunia nyata akan berada di antara dua ekstrem ini.

Jika Anda menyalin antara dua server terpisah, ada lebih banyak faktor yang terlibat.

Saya memiliki array penyimpanan di tempat kerja yang dapat menjenuhkan saluran 3Gb (gigaBIT) SAS ketika melakukan sebagian besar operasi sekuensial. Jika saya memiliki 6Gb SAS, mungkin itu bisa mendekati jenuh juga. Untuk I / O acak, sistem ini berkinerja sangat berbeda berdasarkan apa OSnya (OpenSolaris, misalnya, memiliki I / O acak terburuk, dan Linux XFS yang terbaik dengan faktor 3).

Ada terlalu banyak variabel untuk menjawab pertanyaan ini secara definitif.

sysadmin1138
sumber
3

Berapa lama 1,5TB data yang diperlukan untuk menyalin sangat tergantung pada jenis data. Jika Anda memiliki beberapa file 1.500 1GB, itu mungkin hanya akan memakan waktu beberapa jam, tetapi jika Anda memiliki satu miliar setengah file 1KB mungkin akan memakan waktu berhari-hari.

Ini karena dua spesifikasi yang bersaing pada disk: throughput dan waktu akses rata-rata. Disk tradisional dengan throughput 100MB / detik dan waktu akses 10ms cukup umum. Jika Anda dapat mengalirkan data secara berurutan, Anda bisa mendapatkan 100MB / detik. Namun, jika Anda perlu melompat ke tempat lain dibutuhkan 10 ms. Seandainya Anda streaming, Anda bisa menulis 1MB data pada waktu yang diperlukan untuk melompat ke lokasi lain.

Membuat file dapat membutuhkan beberapa upaya, sehingga membuat file 1KB dapat "dikenakan biaya" sebanyak streaming beberapa MB data.

Jadi, dalam beberapa kasus lebih baik melakukan copy disk mentah dari perangkat blok daripada menyalin di sistem file melalui sesuatu seperti rsync. Jika Anda memiliki banyak file, dalam sistem file yang, katakanlah, 50% atau lebih penuh, Anda seringkali lebih baik hanya menyalin perangkat blok penuh melalui "dd", sejauh waktu yang diperlukan. Tentu saja, Anda tidak dapat melakukan ini saat sistem file dipasang, jadi ini juga memiliki kelemahan.

SSD dapat membantu mengurangi hal ini, karena waktu aksesnya sekitar 100 kali lebih cepat, tetapi drive MLC SSD memiliki masalah akses yang rumit tergantung pada ketersediaan kumpulan blok yang telah dihapus sebelumnya. SSD SLC dapat membantu ini.

Pengontrol RAID dengan cache bawaan dapat membantu dengan pencarian, seperti halnya modul flashcache yang memungkinkan Anda melakukan cache perangkat blok melalui SSD.

Sistem RAID dapat memungkinkan beberapa pencarian paralel, secara efektif mengurangi waktu akses rata-rata, dan juga paralelisasi untuk meningkatkan throughput. Tetapi kinerja keseluruhan Anda akan sering bergantung pada berapa banyak file yang terlibat.

Sean Reifschneider
sumber