Pertanyaan yang diberi tag duplicate

9
Temukan file PDF duplikat berdasarkan konten

Beberapa jurnal menghasilkan PDF yang berbeda untuk setiap unduhan. APS misalnya menyimpan waktu dan alamat IP dalam PDF. Atau ada versi kertas dengan tautan hyper dan satu dengan referensi teks. Bagaimana mungkin menemukan unduhan duplikat kertas dengan 90% konten yang sama pada sistem linux...