Bagaimana saya bisa menemukan lagu duplikat?

31

Judulnya mengatakan itu semua. Bagaimana saya bisa mendeteksi duplikat di perpustakaan media saya?

Ingo
sumber

Jawaban:

24

dupeGuru Music Edition adalah yang Anda inginkan. Setel jenis pemindaian ke "Konten Audio" di Preferensi. Harap dicatat bahwa program ini adalah fairware jadi silakan berkontribusi jika Anda bisa.

teks alternatif

Saya sarankan Anda memasangkan ini dengan MusicBrainz Picard yang dapat menandai file musik Anda secara otomatis.

teks alternatif

Lil o
sumber
SEMPURNA! Akhirnya jawaban yang bekerja seperti pesona :). Plugin Banshee atau apa pun akan lebih baik tetapi ini berfungsi dengan baik! Saya benar-benar menghapus sekitar 8GB dupes, cheers!
Ingo
2
Sayang sekali dupeGuru hanya bisa melakukan 10 kepindahan sekaligus tanpa mengeluarkan uang.
John McKean Pruitt
PPA sudah mati untuk rilis Ubuntu terbaru. Saya berhasil menginstal deb. Langsung dari launchpad.net/~hsoft/+archive/ubuntu/ppa/+build/9735351 dan kemudian berjalan dupeguru_me.
rjh
Versi terbaru tidak memiliki batasan penghapusan. Namun sepertinya itu tidak sidik jari musik, itu hanya membandingkan nama file / informasi ID3. Jika Anda menggunakan alat seperti Picard untuk menandai musik Anda terlebih dahulu, itu harus melakukan pekerjaan dengan baik :)
rjh
10

Ada plugin yang dibuat beberapa waktu lalu untuk ini. Saya sudah menggunakannya baru-baru ini tetapi masih menyisakan sedikit yang diinginkan. Ada " PPA " untuk itu - tetapi belum ada paket yang dibangun, hanya cabang Bazaar. Instruksi pemasangannya seperti ini:

wget http://scrawl.bplaced.net/duplicate-source.tar.gz -O tmp.tar.gz && mkdir -vp ~/.gnome2/rhythmbox/plugins/duplicate-source/ && tar -xf tmp.tar.gz -C ~/.gnome2/rhythmbox/plugins && rm -v tmp.tar.gz

Jika Anda tertarik menggunakan kode sumber Bazaar, lakukan yang berikut:

mkdir -vp ~/.gnome2/rhythmbox/plugins && cd ~/.gnome2/rhythmbox/plugins && bzr branch lp:rb-duplicate-source duplicate-source

Setelah terinstal, restart Rhythmbox dan Anda harus memiliki Duplicate Finder sekarang di daftar plugin.

daftar plugin

Setelah mengaktifkannya - ada opsi konfigurasi tambahan yang tersedia.

jendela konfigurasi

Setelah plugin diaktifkan - dan ketika menemukan duplikat - itu akan menambahkan opsi tambahan ke daftar perpustakaan Anda:

daftar

Beberapa pengaturan yang saya anggap "aneh" - Saya sudah mencoba ini di perpustakaan media dengan lebih dari 120.000 lagu (lebih dari 1.000 duplikat) dan perpustakaan dengan sekitar 1.000 lagu dan mungkin 30 duplikat. Pada yang pertama butuh SANGAT lama dan menabrak Rhythmbox beberapa kali selama pencarian. Saya akhirnya pergi dengan Secara Otomatis "Hapus dari Perpustakaan" untuk menghindari harus membangun kembali daftar. Pada perpustakaan yang lebih kecil semuanya berfungsi dengan baik.

Ketika duplikat ditemukan - jika Anda memiliki opsi default dipilih - versi kualitas lagu yang lebih rendah akan ditambahkan ke daftar. Jadi aman untuk memilih semua lagu pada daftar Duplikat dan "Hapus" (Hapus dari disk atau hapus dari perpustakaan).

Marco Ceppi
sumber
Terima kasih banyak telah memberikan tip ini! Namun, sepertinya tidak ada yang terjadi setelah saya mengaktifkannya. Saya tidak dapat menemukan tab baru atau apa pun di mana duplikat akan ditunjukkan.
Ingo
Anda mungkin perlu memindahkan ambang ke 0,5 untuk membantu memilah duplikat. Ini akan ditampilkan sebagai item tambahan dalam daftar Perpustakaan Anda. Saya telah memperbarui jawaban untuk menunjukkan ini.
Marco Ceppi
Mencoba itu juga. Tidak berhasil
Ingo
5

Anda dapat menggunakan fdupes untuk itu:

$ fdupes -r ~/Music

yang memberi Anda daftar semua file duplikat.

Anda dapat menginstalnya dengan mudah

sudo apt-get install fdupes
Johann
sumber
4
Ini bekerja lebih baik daripada opsi lain. Namun, sepertinya tidak cocok untuk file audio. Perangkat lunak ini tidak membandingkan tag dll. Yang mengarah ke daftar file yang sangat pendek sedangkan dalam kenyataannya ada banyak duplikat, namun mungkin tidak dengan ukuran file yang persis sama (karena mereka mungkin dari sumber yang berbeda).
Ingo
3

Saya mengalami masalah yang sama ketika saya memiliki banyak file gambar duplikat. Dalam kasus saya, saya hanya menggunakan md5sumfile dan mengurutkan hasilnya:

for file in $(find $rootdir -name "*.jpg"); do echo $(md5sum $file); done | sort

File dengan konten yang sama menghasilkan hash yang sama, sehingga duplikat dapat ditemukan dengan mudah. Saya secara manual menghapus dupes dari sana, meskipun saya bisa memperpanjang skrip untuk menghapus semua kecuali kejadian pertama, tapi saya selalu paranoid tentang melakukan hal itu dalam skrip ad-hoc.

Perhatikan bahwa ini hanya berfungsi untuk file duplikat dengan konten yang identik .

John Bode
sumber
Lebih cepat:find $rootdir -name '*.jpg' -exec md5sum {} + | sort
Robert Vila
1

Coba FSlint atau dupe gredtter

Untuk menginstal jenis FSlint di terminal (Ctrl-Alt-T)

sudo apt-get install fslint

semoga ini bermanfaat ..

FOSS DIVERSER
sumber
-2

Saya telah menggunakan FSlint untuk menemukan file duplikat secara umum. FSlint adalah "utilitas untuk menemukan dan membersihkan berbagai bentuk serat pada sistem berkas."

Aputsiak
sumber
Itu aneh. FSlint tidak menemukan lagu duplikat saya!
Ingo
FSlint dengan pengaturan default cenderung menemukan file duplikat yang diukur dengan nama file dan ukuran file, tetapi tidak duplikat lagu jika itu adalah rekaman yang berbeda dengan ukuran dan nama file yang berbeda.
Aputsiak
Rekaman yang berbeda (remix?) Tidak aman untuk dihapus. Mereka mungkin memiliki nilai sendiri.
Extender
Saya juga telah menggunakan fslint untuk audio (dengan kesuksesan yang masuk akal) - meskipun diberi beberapa alternatif di utas ini, saya mungkin akan mencoba salah satu dari mereka di lain waktu.
belacqua