Bagaimana tepatnya rsync memutuskan apa yang akan disinkronkan?

14

Saya menemukan beberapa jawaban untuk pertanyaan, jadi ingin bertanya kepada orang-orang yang benar-benar menggunakannya, daripada hanya ingin membuat blog terbesar dengan mengisi dengan informasi semi-acak yang tidak berguna.

Skenario: Saya rsync -av --progress /dir/a /dir/b dan dia mengerjakannya.

Saya menambahkan file baru ke / dir / a dan menjalankan perintah yang sama lagi, ia tahu apa yang dilakukannya dan hanya menyalin file baru.

Saya menambahkan file baru ke / dir / a dan mengganti nama beberapa file di / dir / b, dan mungkin menghapus beberapa juga.

Jika saya jalankan rsync -av --progress /dir/a /dir/blagi, apa yang akan disalin? Hanya file-file baru karena ia tahu apa yang telah disalin sebelumnya, atau file-file yang diubah namanya / dihapus juga, karena mereka tidak lagi ada.

Dan sebagai bonus, jika file sebelumnya disalin yang disalin lagi, apakah ada cara untuk mencegah itu, sehingga hanya tambahan baru ke / dir / a disalin?

Saat ini saya senang memeriksa hal-hal secara manual, tetapi karena data semakin besar, saya akan membutuhkan lebih banyak otomatisasi untuk melakukan tugas ini.

SPooKYiNeSS
sumber
3
The -iflag sangat berguna. Untuk setiap file, ia memberikan string kecocokan yang dapat didekodekan untuk melihat mengapa itu cocok (flag untuk waktu mod, flag untuk ukuran, dll.)
BowlOfRed

Jawaban:

17

Saya menambahkan file baru ke / dir / a dan menjalankan perintah yang sama lagi, ia tahu apa yang dilakukannya dan hanya menyalin file baru.

Tidak, ia tidak tahu apa yang ia lakukan pada lari sebelumnya. Ini membandingkan data di sisi penerima dengan data yang akan dikirim. Dengan data yang cukup kecil, ini tidak akan terlihat, tetapi ketika Anda memiliki direktori yang cukup besar, waktu yang dihabiskan membandingkan sebelum penyalinan benar-benar dimulai mudah dirasakan.

Pemeriksaan default untuk waktu dan ukuran modifikasi file. Dari man rsync:

-c, --checksum
      This changes the way rsync checks if the files have been changed
      and  are in need of a transfer.  Without this option, rsync uses
      a "quick check" that (by default) checks if each file’s size and
      time of last modification match between the sender and receiver.
      This option changes this to compare a 128-bit checksum for  each
      file  that  has a matching size.  Generating the checksums means
      that both sides will expend a lot of disk I/O  reading  all  the
      data  in  the  files  in  the transfer (and this is prior to any
      reading that will be done to transfer changed  files),  so  this
      can slow things down significantly.

Dan:

-u, --update
      This  forces  rsync  to  skip  any  files  which  exist  on  the
      destination  and  have  a  modified  time that is newer than the
      source  file.   (If  an  existing   destination   file   has   a
      modification time equal to the source file’s, it will be updated
      if the sizes are different.)

Perhatikan bahwa ini tidak tersirat oleh opsi yang Anda gunakan. -aadalah:

-a, --archive               archive mode; same as -rlptgoD (no -H)
-r, --recursive             recurse into directories
-l, --links                 copy symlinks as symlinks
-p, --perms                 preserve permissions
-o, --owner                 preserve owner (super-user only)
-g, --group                 preserve group
    --devices               preserve device files (super-user only)
    --specials              preserve special files
-D                          same as --devices --specials
-t, --times                 preserve times
muru
sumber
Deskripsi terbaik yang pernah saya lihat (sejauh ini), terima kasih
SPooKYiNeSS
2
Sedikit tambahan. File yang diganti nama diperlakukan sebagai file unik di kedua ujungnya. Menentukan --fuzzysekali akan mengenalinya sebagai sama di direktori yang sama. Menggunakan --fuzzydua kali memperluas kemampuan ini ke lokasi lain. Lihat man rsyncdetailnya. Tentu saja, salah satu alasan utama untuk menggunakan rsyncadalah kemampuannya untuk menyalin hanya bagian-bagian dari file yang telah berubah. Ini dapat membuat transfer melalui jaringan lebih cepat. BTW, opsi checksum disebutkan di atas untuk penjelasannya tentang cara rsynckerjanya. Dalam kebanyakan kasus, itu tidak boleh digunakan.
Joe
6

Umum

Jika saya mengerti benar, rsync -avtidak memiliki memori, jadi itu akan menyalin file yang diganti namanya / dihapus juga, karena mereka ada di sumber tetapi tidak lagi ada di target.

Kiat

  • Gunakan opsi -n, 'dry run', untuk memeriksa apa yang terjadi sebelum Anda menjalankan rsyncbaris perintah Anda .

  • Perhatikan makna khusus garis miring setelah direktori sumber, dan lihat perbedaannya

    rsync -av --progress dir/a/ dir/b
    

    dan

    rsync -av --progress dir/a dir/b
    

    yang dijelaskan dalam manual man rsync.

Contoh

Kasing khusus Anda (menambahkan file ke direktori sumber 'a' dan menghapus file dari direktori target 'b') akan menambahkan file yang ditambahkan dan file yang disalin sebelumnya, karena masih dalam direktori sumber. Ini akan terjadi baik dengan dan tanpa opsi -udan saya tidak tahu opsi apa pun rsyncuntuk memperbaikinya dengan mudah, jika Anda ingin menyimpannya di direktori sumber.

Tetapi Anda dapat menghapusnya dari direktori sumber atau memasukkan nama file ke dalam file excludeddan menggunakan opsi --exclude-from=excluded(untuk banyak file) atau hanya --exclude=PATTERNuntuk satu atau beberapa file.

$ rsync -avn --progress dir/a/ dir/b
sending incremental file list
./
file-1
file-2

sent 103 bytes  received 25 bytes  256.00 bytes/sec
total size is 13  speedup is 0.10 (DRY RUN)

$ rsync -av --progress dir/a/ dir/b
sending incremental file list
./
file-1
              6 100%    0.00kB/s    0:00:00 (xfr#1, to-chk=1/3)
file-2
              7 100%    6.84kB/s    0:00:00 (xfr#2, to-chk=0/3)

sent 196 bytes  received 57 bytes  506.00 bytes/sec
total size is 13  speedup is 0.05

$ echo textx-3>./dir/a/file-3

$ rsync -avn --progress dir/a/ dir/b
sending incremental file list
./
file-3

sent 121 bytes  received 22 bytes  286.00 bytes/sec
total size is 21  speedup is 0.15 (DRY RUN)

$ rm dir/b/file-1 
rm: ta bort normal fil 'dir/b/file-1'? y

$ rsync -avn --progress dir/a/ dir/b
sending incremental file list
./
file-1
file-3

sent 124 bytes  received 25 bytes  298.00 bytes/sec
total size is 21  speedup is 0.14 (DRY RUN)

$ rsync -avun --progress dir/a/ dir/b
sending incremental file list
./
file-1
file-3

sent 124 bytes  received 25 bytes  298.00 bytes/sec
total size is 21  speedup is 0.14 (DRY RUN)

$ rsync -avun --exclude=file-1 --progress dir/a/ dir/b
sending incremental file list
./
file-3

sent 104 bytes  received 22 bytes  252.00 bytes/sec
total size is 15  speedup is 0.12 (DRY RUN)

Alternatif: unison

Anda mungkin ingin menguji alat ini unison, yang merupakan alat sinkronisasi . Ini menyediakan metode visual untuk mengidentifikasi kasus-kasus khusus dan memutuskan apa yang harus dilakukan. Ada versi GUI ( unison-gtk).

sudodus
sumber
Contoh yang bagus terima kasih. Saya tahu / pada akhirnya, saya hanya menanyakan ini dari aplikasi, dan melewatkannya (dan Anda dapat dengan jelas melihat saya hanya menyalin / memposting
SPooKYiNeSS
Dan lagi itu mengirimkan sebelum saya selesai dan tidak akan membiarkan saya mengedit komentar saya ... Menyalin / menempel yang kedua. Saya akan melihat luar biasa dan melihat apakah itu dapat melakukan apa yang saya inginkan, dan jika tidak saya akan kembali ke rencana b dan hanya membuat skrip
SPooKYiNeSS
Saya telah menggunakan unison-gtkselama beberapa tahun, dan saya senang dengan itu. (Saya menggunakan rsyncjuga.)
sudodus
1

Ini hanya menyalin file-file baru di / dir / a. Apa pun yang Anda lakukan di / dir / b akan diabaikan, kecuali jika Anda menggunakan opsi --delete. Dalam hal ini, file yang diubah namanya di / dir / b akan dihapus. Ini akan memaksa / dir / b untuk menjadi persis seperti / dir / a.

Tentang bonus, maksud Anda seperti dalam kasus mengganti nama file di / dir / a, dan kemudian rsyncing ke / dir / b? Saya rasa tidak ada cara untuk mencegah rsync dari hanya menyalin file lagi dalam kasus itu.

Hermann Ingjaldsson
sumber
Saya tidak berharap akan ada jalan, selain menggunakan atribut untuk menentukan, tetapi kemudian jika membuat skrip kiddie dan akan membutuhkannya lagi. Terima kasih atas jawaban Anda, setidaknya sekarang saya tahu apa yang harus saya lakukan.
SPooKYiNeSS