Salah satu cara paling umum untuk menentukan apakah dua file identik (dengan asumsi ukurannya cocok) menggunakan program untuk membuat " hash " (intinya sidik jari) dari suatu file. Yang paling umum adalah md5sum
dan sha1sum
.
Sebagai contoh:
$ md5sum file1 file2
e0e7485b678a538c2815132de7f9e878 file1
4a14aace18d472709ccae3910af55955 file2
Jika Anda memiliki banyak file yang perlu Anda periksa, misalnya jika Anda mentransfer direktori penuh file dari satu sistem ke yang lain, Anda dapat mengarahkan output dari sistem asli ke file, maka md5sum
/ sha1sum
secara otomatis dapat menggunakan file itu untuk memberi tahu Anda file mana yang berbeda:
$ md5sum file1 file2 > MD5SUMS
... copy file1, file2, MD5SUMS across
$ md5sum --check MD5SUMS
file1: OK
file2: OK
Menemukan solusi - alat cmp yang hadir dengan sebagian besar rasa Linux.
sumber
Jika saya hanya ingin tahu apakah mereka sama, saya lebih suka menggunakan sha1sum jika tersedia, atau md5 sebagai cadangan.
Jika saya ingin tahu betapa berbedanya mereka, atau di mana mereka berbeda, satu hal yang berfungsi adalah untuk engkol mereka berdua melalui od ('octal dump', yang biasanya memiliki opsi hex) untuk membuat file sementara dan kemudian diff mereka.
sumber
Saya hanya menjalankan beberapa tolok ukur pada file 100+ MB. diff adalah yang tercepat, sementara cmp berada di urutan kedua, dan menggunakan md5sum berada di urutan terakhir.
Saya mengulangi latihan dengan file 4,3 GB, dan harus menghapus dan membuat ulang file dengan dd karena cache RAM sangat mempengaruhi hasil.
Berdasarkan hasil ini saya akan merekomendasikan memindahkan file ke mount RAMFS, dan tetap dengan diff.
sumber