Hapus duplikat mp3 dengan nama, ukuran, dan hash yang berbeda

9

Saya memiliki perpustakaan musik besar-besaran (semua mp3), tetapi saya beberapa musiknya hampir sama tetapi:

  1. Mungkin satu atau dua detik lebih lama
  2. Sekitar 97% sama dengan lagu lain
  3. Atau bitrate lain.

Apakah ada cara untuk menemukan duplikat ini? Seperti yang disebutkan mereka tidak memiliki ukuran, nama, atau SHA1-hash yang sama.

Hans Groeffen
sumber

Jawaban:

3

Ada sistem sidik jari akustik open source yang disebut Echoprint , Anda mungkin ingin memeriksa Saya ingin menduplikat koleksi besar . Saya belum pernah menggunakannya sebelumnya (hanya tersandung di atasnya), tetapi kedengarannya luar biasa untuk dapat melakukan ini secara lokal.

Adrian Frühwirth
sumber
Terlepas dari ini, jika file Anda ditandai dengan benar (saya tidak yakin apakah dengan nama yang Anda maksud adalah nama file dan / atau tag ID3), ada juga alat deduplikasi yang bekerja berdasarkan tag.
Adrian Frühwirth
6

Gunakan MusicBrainz's Picard . Ini memindai musik untuk menghasilkan 'sidik jari' dan kemudian membandingkannya dengan database online untuk mengidentifikasinya (menarik semua info seperti Artis, Album, dll).

Setelah mengidentifikasi lagu, lagu tersebut dapat diorganisasikan ke dalam direktori kustom & struktur nama, dan Anda dapat menggunakannya untuk menemukan duplikat.

Sepenuhnya kompatibel dengan linux.

Patrick
sumber
Ini adalah cara yang pasti untuk dilakukan, bekerja dengan baik.
slm
Ok, saya pikir saya punya masalah. Tidak ada musik saya yang komersial. Sebagian besar adalah lisensi CC yang diunduh dari Jamendo. Dikatakan tidak dapat menemukan kecocokan.
Hans Groeffen
@HansGroeffen maka itu akan menjadi masalah. Anda diizinkan untuk menerbitkan sidik jari dari musik yang sebelumnya tidak dikenal, sehingga Anda dapat melakukannya, tetapi Anda harus berupaya untuk memvalidasi bahwa pengajuannya akurat. Karena Anda memiliki nama yang tidak cocok, itu mungkin bukan ide yang baik. Saya tidak yakin apakah ada cara untuk menggunakannya untuk sidik jari dan kemampuan perbandingan.
Patrick
2
Basis data MusicBrainz yang digunakan Picard dapat diedit pengguna. Anda dapat membuat entri baru untuk artis, karya (lagu) dan rilis (album / EP), dan kemudian menggunakan Picard untuk menandai ulang / memindahkan file. Ini sedikit usaha, tetapi berhasil - dan ini membantu orang lain.
nucky101
3

Saya sarankan menggunakan beetsdengan duplicatespluginnya; beetsmirip dengan picarddalam hal fungsionalitas (dapat mencari info ID3 dari database musicbrainz dan mengatur file Anda berdasarkan info itu), tetapi melampaui kemampuan picard dengan beberapa pluginnya.

Secara pribadi saya menggunakannya bersama - picard untuk membersihkan tag ID3 dan bit untuk mengatur file dan membersihkan duplikat.

STW
sumber