Saya punya banyak file yang perlu saya sortir; dan sayangnya ada banyak file dengan nama yang sama tetapi konten berbeda, dan ada konten yang sama dengan nama file berbeda.
Saya sedang berpikir tentang menggunakan md5sum
untuk menghasilkan checksum untuk file, tetapi saya perlu tahu - apakah mungkin dua file berbeda (mis. Konten yang berbeda) akan menghasilkan checksum yang sama?
Jika ya, seberapa besar kemungkinan hal itu terjadi?
Apakah mungkin untuk menggunakan dua program checksum yang tidak terkait (mis. Tidak dalam "keluarga" yang sama) untuk menghasilkan dua checksum - dengan asumsi bahwa sementara dua file berbeda dapat menghasilkan checksum yang sama untuk salah satu program checksum, itu tidak akan pernah terjadi pada keduanya sekaligus?
Jawaban:
Dua file dengan konten yang sama tetapi nama file berbeda: ( file1 dan file2 ):
Dua file dengan konten berbeda tetapi nama file yang sama: ( file1 dan file1 )
Dari entri wiki ,
Tapi, algoritma MD5 memiliki kekurangannya sendiri.
Saya akan merekomendasikan menggunakan sha1 untuk menghitung checksum karena memproduksi tabrakan tidak mudah ketika menggunakan algoritma sha1 . Memproduksi sha1 checksum cukup mudah seperti yang Anda lihat di sini .
sumber
sha1
tidak relevan dengan tugas itu; itu hanya penting ketika mementingkan keamanan .