Hapus Duplikat Pesan dari Maildir

10

Saya punya banyak pesan duplikat di Maildir server IMAP saya. Apa cara terbaik untuk menghapusnya?

Beberapa poin yang relevan:

  • Shared Message-ID biasanya merupakan definisi duplikat yang cukup baik. Sebuah skrip kecil yang menghapus semua kecuali satu dari pesan duplikat akan berfungsi.
  • Terkadang perlu untuk menemukan duplikat berdasarkan badan pesan bersama. Apa definisi yang masuk akal dari dibagikan di sini? Setara bitwise? Bagaimana dengan perbedaan aneh dalam pembungkus baris, melarikan diri, pengkodean karakter?
  • Terkadang ada beberapa perbedaan bermakna antara pesan 'duplikat'. Apa cara terbaik untuk meninjau perbedaan dalam set pesan 'duplikat'? Berbeda?
Joseph Holsten
sumber

Jawaban:

6

Saya telah membuat beberapa perbaikan signifikan pada naskah Kevin yang disebutkan di atas, dan dia cukup baik untuk menerima permintaan penarikan saya. Akhirnya kami membagi ini menjadi proyek khusus yang dapat Anda temukan di sini:

https://github.com/kdeldycke/maildir-deduplicate

Adam Spires
sumber
Skrip ini pindah ke lokasi baru sehingga saya memperbarui tautannya.
Adam Spires
3

untuk file generik di linux, saya menggunakan utils fdupes untuk menghapus file duplikat. Saya menemukan itu juga berfungsi untuk pesan Maildir.

sarabande
sumber
1
fdupes tampaknya bekerja hanya untuk duplikat yang tepat, sementara OP (secara implisit) bertanya tentang pola duplikasi yang lebih kompleks. Sebuah pesan dikirimkan dua kali karena .forwardatau apa pun yang memiliki tajuk yang sedikit berbeda, jadi meskipun pesan itu sendiri adalah duplikat, dua file yang berisi dua salinan tersebut mungkin tidak.
tripleee
0

Gnome's Evolution [agen pengguna email grafis] memiliki fitur bawaan untuk menghapus surat duplikat. Sebagaimana dijelaskan pada halaman bantuan ini , itu bermuara pada:

  1. Pilih pesan yang dicurigai (atau hanya semua pesan)
  2. Pergi ke menu Pesan , pilih Hapus Pesan Duplikat .

Voa.

PS Evolution dapat mengakses pesan Anda secara lokal (MailDir, MH, Mbox) atau melalui IMAP.

Franklin Piat
sumber
0

Yang terbaik yang saya temukan hari ini adalah deddliclicate maildir- Kevin Deldycke .

  • Itu mengabaikan X-MIMETrackheader secara default dan membandingkan header menggunakan SHA224intisari.
  • Secara otomatis menghapus duplikat tanpa meminta konfirmasi; namun ada mode dry-run yang memungkinkan pratinjau duplikat mana yang akan dihapus.

Saya yakin seseorang dapat membuat sesuatu yang mewah dari delIMAPdups.pl Rick Sanders , bagian dari Alat IMAP- nya .

Joseph Holsten
sumber
maildir-deduplicate pindah ke lokasi baru jadi saya memperbarui tautannya. Namun informasi Anda sekarang kedaluwarsa.
Adam Spires
Saya telah memperbarui ini sehingga tidak ada lagi info usang yang menyesatkan.
Adam Spires