Apakah perintah saya untuk mengkloning drive optimal?

16

Saya telah melakukan setengah jam membaca untuk bersiap-siap untuk mengkloning hard drive saya. Ini memiliki beberapa partisi, termasuk partisi Windows. Saya akan membeli hard drive eksternal yang sangat besar untuk cadangan. Saya ingin dapat menggunakan klon ini untuk mengembalikan seluruh drive jika terjadi kesalahan (saya akan melakukan beberapa OS re-shuffling). Saya ingin belajar bagaimana melakukan ini menggunakan dd, karena saya suka alat tingkat rendah yang tidak perlu menginstal apa pun.

Saya menemukan kode bermanfaat berikut dari forum ubuntu (dimasukkan dari root shell menggunakan live CD):

dd if=/dev/hda of=/dev/hdb & pid=$!
while kill -USR1 $pid; do sleep 1; done

(Saya tahu bahwa saya harus mengedit lokasi input dan output.) Namun saya punya dua pertanyaan. Yang pertama sangat noobie: perintah ini dibagi menjadi dua baris. Tentunya ketika saya menekan enter setelah tanda seru itu akan memulai proses?

Dua, di situs lain disarankan memasukkan ukuran blok. Seperti ini:

# dd if=/dev/hda conv=sync,noerror bs=64K of=/mnt/sda1/hda.img

Saya tidak tahu apa-apa tentang ukuran blok. Apakah 64K benar? Sepertinya ukuran blok saya adalah 512 byte dari berikut ini, output dari sudo fdisk -ul:

Disk /dev/sda: 750.2 GB, 750156374016 bytes
255 heads, 63 sectors/track, 91201 cylinders, total 1465149168 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disk identifier: 0xc3ffc3ff

   Device Boot      Start         End      Blocks   Id  System
/dev/sda1   *          63   143364059    71681998+   7  HPFS/NTFS/exFAT
Partition 1 does not start on physical sector boundary.
/dev/sda2       976867328  1465147391   244140032    7  HPFS/NTFS/exFAT
/dev/sda3       143364094   976867327   416751617    5  Extended
Partition 3 does not start on physical sector boundary.
/dev/sda5       143364096   162895871     9765888   82  Linux swap / Solaris
/dev/sda6       162897920   205864959    21483520   83  Linux
/dev/sda7       205867008   976867327   385500160   83  Linux

Partition table entries are not in disk order

Disk /dev/mapper/cryptswap1: 10.0 GB, 10000269312 bytes
255 heads, 63 sectors/track, 1215 cylinders, total 19531776 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disk identifier: 0x433bb3a7

Disk /dev/mapper/cryptswap1 doesn't contain a valid partition table

Terima kasih.

Kit Johnson
sumber
Sudahkah Anda mencoba yang sederhana dd if=/dev/hda of=hdb? Berikut adalah jawaban yang menunjukkan beberapa detail termasuk runtime untuk 160 GB: askubuntu.com/questions/435694/…
SDsolar
Versi terbaru dari Ubuntu menggunakan coreutils v.8.24 atau yang lebih baru yang ddmencakup sakelar progres seperti yang disebutkan di sini
Penatua Geek

Jawaban:

22

Kemajuan

Perintah yang Anda daftarkan

dd if=/dev/hda of=/dev/hdb & pid=$!
while kill -USR1 $pid; do sleep 1; done

adalah dua baris yang bagus untuk mendapatkan kemajuan ddsecara teratur. Saya menggunakan yang sangat mirip juga. Kelihatan bagus. Mungkin menemukannya di sini ?

Blokir dengan dd: perataan dan kinerja

Anda dapat menambahkan ukuran blok tempat operasi berlangsung. Tidak masalah apa ukuran blok perangkat blok yang mendasarinya untuk menyelesaikan operasi dengan baik, tetapi untuk alasan kinerja Anda mungkin ingin memilih yang sesuai dengan kebutuhan Anda.

Pertama-tama, ada hal penyelarasan . Jika perangkat blok Anda beroperasi sebagai 512KiB (seperti flash drive lakukan), akan sangat disayangkan untuk dijalankan dddengan bs=512(byte) karena ini akan menyebabkan 1024 write (!) Untuk setiap blok dari perspektif perangkat. Dalam prakteknya tidak akan seburuk ini karena penulisan buffer dan dilakukan sekaligus, tetapi selama sinkronisasi masih dapat meningkatkan jumlah penulisan banyak.

Kemudian pertimbangkan juga penggunaan overhead CPU saat berhadapan dengan sejumlah kecil operasi kecil. Hanya lebih efisien untuk mengambil megabita sekaligus ketika menyalin data dalam jumlah besar.

Praktik terbaik saya adalah mulai dengan 1MB karena itu adalah kelipatan bagus dari sebagian besar pengaturan, termasuk ukuran garis RAID, ukuran LVM, dll. Di laptop saya dengan SSD saya cenderung melihat sedikit peningkatan menggunakan 10MB sebagai ukuran blok, sedangkan saya tidak melihatnya lagi di hard drive fisik saya.

Blok terakhir

Jangan khawatir tentang ukuran drive / volume yang bukan kelipatan dari ukuran blok. Blok terakhir ddakan disalin akan disesuaikan untuk mencocokkan bit data terakhir di dalamnya. Anda dapat melihat apakah blok terakhir memiliki ukuran yang berbeda dengan melihat output.

18335302+0 records out

The +0berarti bahwa itu adalah pertandingan yang tepat, sebuah +1cara yang itu tidak. Bukan masalah besar.

Lihat juga

gertvdijk
sumber
1
Wow, jawaban yang sangat teliti. Terima kasih banyak telah meluangkan waktu untuk melakukannya. Saya akan memperbarui pertanyaan awal dengan tautan ke sumber saya. Saya akan pergi dengan 1 MB. Jadi perintah saya akan seperti ini, apakah saya benar? # dd if=/dev/hda conv=sync,noerror bs=1MB of=/mnt/sda1/hda.img & pid=$! while kill -USR1 $pid; do sleep 1; done
Kit Johnson
2
@oldmankit Saya akan melakukan bs=1Mkarena kekuatan 2, daripada bs=1MBmenjadi kekuatan 10. Tapi jalankan beberapa tolok ukur pada sistem Anda jika Anda dapat melihat apa yang terbaik.
gertvdijk
4
Perhatikan bahwa sebagaimana disebutkan di sini sejak rilis coreutils> = 8.24 (default di Ubuntu Xenial 16.04 ke atas) tidak lagi diperlukan untuk kill -USR1 $pidsekarang memiliki laporan kemajuan yang tersedia dengan menambahkan status=progresssakelar
Penatua Geek
10

Seperti yang dikatakan orang lain, tidak ada ukuran blok yang benar secara universal; apa yang optimal untuk satu situasi atau satu perangkat keras mungkin sangat tidak efisien untuk yang lain. Juga, tergantung pada kesehatan disk, mungkin lebih baik menggunakan ukuran blok yang berbeda dari apa yang "optimal".

Satu hal yang cukup dapat diandalkan pada perangkat keras modern adalah ukuran blok default 512 byte cenderung hampir urutan besarnya lebih lambat daripada alternatif yang lebih optimal. Ketika ragu, saya menemukan bahwa 64K adalah standar modern yang cukup solid. Meskipun 64K biasanya bukan ukuran blok yang optimal, dalam pengalaman saya itu cenderung jauh lebih efisien daripada standar. 64K juga memiliki sejarah yang cukup solid untuk menjadi pemain yang andal: Anda dapat menemukan pesan dari milis Eug-Lug , sekitar tahun 2002, merekomendasikan ukuran blok 64K.

Untuk menentukan ukuran blok keluaran optimal, saya telah menulis skrip berikut yang menguji penulisan file uji 128M dengan dd pada berbagai ukuran blok yang berbeda, dari default 512 byte ke maksimum 64M. Berhati-hatilah, skrip ini menggunakan dd secara internal, jadi gunakan dengan hati-hati.

dd_obs_test.sh:

#!/bin/bash

# Since we're dealing with dd, abort if any errors occur
set -e

TEST_FILE=${1:-dd_obs_testfile}
TEST_FILE_EXISTS=0
if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=1; fi
TEST_FILE_SIZE=134217728

if [ $EUID -ne 0 ]; then
  echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2
fi

# Header
PRINTF_FORMAT="%8s : %s\n"
printf "$PRINTF_FORMAT" 'block size' 'transfer rate'

# Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M
for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864
do
  # Calculate number of segments required to copy
  COUNT=$(($TEST_FILE_SIZE / $BLOCK_SIZE))

  if [ $COUNT -le 0 ]; then
    echo "Block size of $BLOCK_SIZE estimated to require $COUNT blocks, aborting further tests."
    break
  fi

  # Clear kernel cache to ensure more accurate test
  [ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches

  # Create a test file with the specified block size
  DD_RESULT=$(dd if=/dev/zero of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync 2>&1 1>/dev/null)

  # Extract the transfer rate from dd's STDERR output
  TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?')

  # Clean up the test file if we created one
  if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fi

  # Output the result
  printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE"
done

Lihat di GitHub

Saya hanya menguji skrip ini pada sistem Debian (Ubuntu) dan pada OSX Yosemite, jadi mungkin perlu beberapa penyesuaian untuk membuat pekerjaan pada rasa Unix lainnya.

Secara default perintah akan membuat file uji yang bernama dd_obs_testfiledalam direktori saat ini. Atau, Anda bisa memberikan lintasan ke file pengujian khusus dengan memberikan lintasan setelah nama skrip:

$ ./dd_obs_test.sh /path/to/disk/test_file

Output dari skrip adalah daftar ukuran blok yang diuji dan laju transfer masing-masing seperti:

$ ./dd_obs_test.sh
block size : transfer rate
       512 : 11.3 MB/s
      1024 : 22.1 MB/s
      2048 : 42.3 MB/s
      4096 : 75.2 MB/s
      8192 : 90.7 MB/s
     16384 : 101 MB/s
     32768 : 104 MB/s
     65536 : 108 MB/s
    131072 : 113 MB/s
    262144 : 112 MB/s
    524288 : 133 MB/s
   1048576 : 125 MB/s
   2097152 : 113 MB/s
   4194304 : 106 MB/s
   8388608 : 107 MB/s
  16777216 : 110 MB/s
  33554432 : 119 MB/s
  67108864 : 134 MB/s

(Catatan: Unit tingkat transfer akan bervariasi berdasarkan OS)

Untuk menguji ukuran blok baca optimal, Anda dapat menggunakan lebih atau kurang proses yang sama, tetapi alih-alih membaca dari /dev/zerodan menulis ke disk, Anda akan membaca dari disk dan menulis ke /dev/null. Script untuk melakukan ini mungkin terlihat seperti ini:

dd_ibs_test.sh:

#!/bin/bash

# Since we're dealing with dd, abort if any errors occur
set -e

TEST_FILE=${1:-dd_ibs_testfile}
if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=$?; fi
TEST_FILE_SIZE=134217728

# Exit if file exists
if [ -e $TEST_FILE ]; then
  echo "Test file $TEST_FILE exists, aborting."
  exit 1
fi
TEST_FILE_EXISTS=1

if [ $EUID -ne 0 ]; then
  echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2
fi

# Create test file
echo 'Generating test file...'
BLOCK_SIZE=65536
COUNT=$(($TEST_FILE_SIZE / $BLOCK_SIZE))
dd if=/dev/urandom of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync > /dev/null 2>&1

# Header
PRINTF_FORMAT="%8s : %s\n"
printf "$PRINTF_FORMAT" 'block size' 'transfer rate'

# Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M
for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864
do
  # Clear kernel cache to ensure more accurate test
  [ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches

  # Read test file out to /dev/null with specified block size
  DD_RESULT=$(dd if=$TEST_FILE of=/dev/null bs=$BLOCK_SIZE 2>&1 1>/dev/null)

  # Extract transfer rate
  TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?')

  printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE"
done

# Clean up the test file if we created one
if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fi

Lihat di GitHub

Perbedaan penting dalam hal ini adalah bahwa file uji adalah file yang ditulis oleh skrip. Jangan arahkan perintah ini ke file yang ada atau file yang ada akan ditimpa dengan data acak!

Untuk perangkat keras khusus saya, saya menemukan bahwa 128K adalah ukuran blok input paling optimal pada HDD dan 32K paling optimal pada SSD.

Meskipun jawaban ini mencakup sebagian besar temuan saya, saya perlu menentukan ukuran blok dd optimal cukup kali saya menulis posting blog tentang hal itu. Anda dapat menemukan lebih spesifik tentang tes yang saya lakukan di sana.

Posting StackOverflow ini mungkin juga berguna: dd: Bagaimana cara menghitung blocksize yang optimal?

tdg5
sumber
Ajari pria memancing = +1
HackSlash
@ tdg5 Ini adalah skrip yang bagus, tetapi mengalami kesalahan fatal ketika dieksekusi dari dalam Cygwin di lingkungan Windows 7. Apakah ada versi yang dapat digunakan di Cygwin?
Hashim