Adakah yang bisa menyarankan utilitas deteksi duplikasi foto yang baik yang bekerja dengan baik ketika saya berurusan dengan sekitar 100gb data (dikumpulkan selama bertahun-tahun)?
Saya lebih suka sesuatu yang berfungsi di Ubuntu.
Terima kasih sebelumnya!
Sunting: Apakah ada alat yang akan membantu saya mengatur ulang koleksi saya dan menghapus duplikat, setelah mereka terdeteksi?
Sunting2: Bagian yang sulit adalah mencari tahu apa yang harus dilakukan setelah saya memiliki output yang terdiri dari ribuan file duplikat (seperti output dari fdupes).
Tidak jelas apakah saya masih dapat dengan aman menghapus direktori (yaitu jika suatu direktori mungkin berisi file unik), direktori mana yang merupakan himpunan bagian dari direktori lain dan seterusnya. Alat yang ideal untuk masalah ini harus dapat menentukan duplikasi file dan kemudian menyediakan sarana yang kuat untuk merestrukturisasi file dan folder Anda. Melakukan penggabungan dengan hardlinking (seperti halnya fslint) memang membebaskan ruang disk tetapi tidak memecahkan masalah mendasar yang memunculkan duplikasi untuk memulai dengan - yaitu file / dir organisasi yang buruk.
sumber
Jawaban:
ImageMagick untuk menyelamatkan. Saya pikir langkah pertama untuk solusi apa pun adalah mengurangi ukuran koleksi Anda. Jika Anda ingin membandingkan foto dengan kontennya , terutama ketika beberapa versi yang sedikit dimodifikasi satu sama lain, awal yang sangat baik adalah menguranginya menjadi gambar mini dan kemudian membandingkan gambar mini. Ini sangat membantu ketika Anda ingin menemukan foto yang hampir mirip dan ingin "mengabaikan" perbedaan yang tidak penting selama perbandingan.
Saran saya adalah, pada tingkat tinggi, agar Anda:
1- Gunakan alat mogrify ImageMagick untuk mengurangi foto menjadi thumbnail. Ini akan memakan waktu tetapi akan membuat langkah-langkah perbandingan yang sebenarnya jauh lebih cepat dan lebih akurat.
2 - Gunakan alat perbandingan ImageMagick yang memungkinkan Anda untuk menetapkan ambang batas untuk perbandingan, yaitu memungkinkan Anda menemukan foto yang 85% sama. Anda ingin melakukan percobaan terkontrol untuk mengetahui nilai ambang yang paling Anda sukai.
sumber
Penampil foto terbuka / penyelenggara Geeqie memiliki Fitur Temukan Duplikat yang kuat . Itu dapat menggunakan beberapa strategi berbeda untuk menemukan duplikat:
Ini memberikan daftar hasil yang dapat menyertakan thumbnail sehingga Anda dapat mengonfirmasi secara manual.
Ini akan mungkin lambat selama ribuan file, tapi saya pikir hanya menggunakannya dan membiarkannya berjalan selama beberapa hari atau apa pun yang mungkin kurang keseluruhan upaya daripada menemukan atau membuat sesuatu disesuaikan untuk kasus - kecuali pertandingan checksum adalah semua yang Anda butuhkan.
sumber
Ada sedikit utilitas yang disebut "fdupes" yang dapat melakukan apa yang Anda inginkan?
Ada juga utilitas lain yang disebut "fslint" yang mungkin ingin Anda coba juga. (Yang ini memiliki GUI).
sumber
fdupes
- ada opsi untuk menghapus dupes. askubuntu.com/a/476732dupeGuru Picture Edition adalah pencari gambar duplikat yang dapat disesuaikan untuk Windows, Mac OS X dan Linux.
Ada beberapa versi dupeGuru (edisi standar, musik & gambar), dan edisi gambar memungkinkan Anda menemukan gambar yang mirip secara visual melalui algoritma perbandingan pemblokiran bitmap , di antara metode lain (seperti cap waktu gambar asli EXIF, atau file yang identik) .
Ini memiliki berbagai fitur berguna lainnya seperti folder yang dikecualikan, dukungan untuk pustaka iPhoto / Aperture, dan kustomisasi yang cukup besar tentang cara mendeteksi duplikat dan apa fungsinya.
sumber
Apa yang Anda maksud dengan foto rangkap? Apakah maksud Anda file yang identik, katakan saja disalin satu atau dua waktu tambahan? atau maksud Anda foto yang "terlihat" sama.
Jika Anda bermaksud file yang identik, Anda dapat menggunakan 'shasum' pada semua file, kemudian memesan hasilnya dan menemukan baris unik dengan 'uniq' dan menjalankan 'diff' untuk melihat apa yang telah dihilangkan. Semua mudah di shell Ubuntu.
sumber
Ada aplikasi yang disebut "bleachbit", yang menemukan file duplikat berdasarkan ukuran, nama, dan filter lainnya. Anda dapat menginstalnya dari manajer paket synapctic di ubuntu.
sumber