Saya menjelajahi folder spam saya (yang jarang saya lakukan, karena Gmail jarang memiliki false positive) dan saya perhatikan sesuatu yang menarik:
Sesuatu seperti lebih dari setengah pesan memiliki setidaknya satu emoji animasi di subjek.
Tidak ada teman saya yang akan menggunakan omong kosong itu. Tidak ada perusahaan yang valid yang akan melakukan bisnis dengan saya.
Bagaimana saya bisa membuat filter untuk, mungkin, menghapus pesan secara otomatis dengan emoji animasi di subjek?
Dengan menggunakan petunjuk jamesmstone di bawah, saya mencoba mencari dengan subject:=?UTF-8?
dan subject:"=?UTF-8?"
dan beberapa permutasi lainnya, tetapi tidak ada yang berhasil.
Berikut adalah kumpulan contoh header dari salah satu tumpukan mengepul ini:
Delivered-To: [redacted]@gmail.com
Received: by 10.107.28.200 with SMTP id c191csp1104992ioc;
Sun, 24 Jan 2016 19:07:16 -0800 (PST)
X-Received: by 10.107.38.5 with SMTP id m5mr15068933iom.15.1453691236564;
Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Return-Path: <[email protected]>
Received: from mythirdxyz.xyz ([2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11])
by mx.google.com with ESMTP id o10si8722554igw.41.2016.01.24.19.07.15
for <[redacted]@gmail.com>;
Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Received-SPF: pass (google.com: domain of [email protected] designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) client-ip=2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11;
Authentication-Results: mx.google.com;
spf=pass (google.com: domain of [email protected] designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) [email protected];
dkim=pass [email protected];
dmarc=pass (p=REJECT dis=NONE) header.from=mythirdxyz.xyz
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=mythirdxyz.xyz;
[email protected]; q=dns/txt; s=default; t=1453691229;
bh=GuM9JCP4yh7WfVbRBortR7UAr6DAtlgy0oTCna0iWQk=; h=MIME-Version :
Content-Type : Content-Transfer-Encoding : To : From : Subject : Date :
Message-ID : From : Subject : Date;
b=e/zS14UB4o5MhYlfbpsy0h2G/oZyoC5H3ouyhNh13zcSHSNXzI6uvJpIy9a+za2ng26Xe2
NfAI7nenAMCdHJSGF4yfmtTi3+XrR2MqQPHQ1fzTXGhRy/ktCj4tEqt7DhSxnRCqkYFUNaLA
wh3FMLr6IxPi2Z7xUXm3JBffhDcSU=
MIME-Version: 1.0
Content-Type: text/html; charset="utf-8"
Content-Transfer-Encoding: base64
To: [redacted]@gmail.com
From: "APPROVAL DEPARTMENT" <[email protected]>
Subject: =?utf-8?q?=F3=BE=93=A0_Personal_loan_as_soon_as_tomorrow_=F3=BE=93=A0?=
Date: Sun, 24 Jan 2016 19:07:09 -0800
Message-ID: <[email protected]>
goomoji
...Jawaban:
Jawaban singkat
Alih-alih menggunakan Filter Gmail yang bergantung pada fitur pencarian Gmail untuk mencari emoji yang disandikan dalam pesan orignal, buat skrip menggunakan metode GmailMessage :: getRawContent () dari Google Apps Script untuk memproses pesan.
Pertanyaan-pertanyaan Terkait
Berikut ini adalah tautan ke jawaban untuk pertanyaan serupa di situs ini termasuk skrip yang menggunakan metode yang dirujuk.
sumber
Saya telah membuat Skrip Google Apps untuk tujuan seperti itu.
Itu ada di Github: https://github.com/spamzero/spamzero
Ini memungkinkan Anda membuat segala macam aturan lanjutan yang dapat Anda cocokkan dengan folder pesan spam Anda, sehingga pesan yang pasti merupakan spam akan dibersihkan secara otomatis.
sumber
Ini bukan apa yang Anda minta (memfilter emoji sendiri daripada pesan dengan emoji) tetapi Anda mungkin menemukan beberapa konten yang berguna untuk membangun filter pesan yang lebih baik.
Sekarang ada skrip pengguna Greasemonkey / Tampermonkey / Violentmonkey open-source untuk menghilangkan kecoak visual yang menjengkelkan (hanya karakter, bukan pesan itu sendiri):
Baris Subjek Gmail Motel Emoji Roach
Melihat sumber skrip itu , Anda akan melihat bahwa ada dua jenis kecoak emoji umum yang akan Anda temukan dalam surel dari pemasar kasar (saat ini termasuk eBay dan Amazon, sayangnya):
Kecoak berbasis gambar HTML (termasuk animasi yang mengerikan) alias goomoji
Kecoak Unicode: Masih banyak emoji (dan urutan Unicode lainnya yang menghasilkan gambar) yang dilakukan oleh spammer dan pemasar lainnya yang mulai digunakan dalam baris subjek email dan bahwa gmail tidak dikonversi ke gambar HTML. Di beberapa peramban ini tampak berani dan berwarna, yang hampir sama buruknya dengan animasi. Browser juga dapat memilih untuk menghidupkan ini, tetapi saya tidak tahu jika ada yang melakukannya. Urutan Unicode ini bisa ditampilkan oleh browser sebagai teks Unicode, sehingga tampilan yang tepat (berwarna atau tidak, animasi atau tidak, ...) tergantung pada sistem rendering teks apa yang digunakan browser. Tampilan emoji Unicode yang diberikan juga tergantung pada setiap pemilih variasi Unicode dan pengubah emojiyang muncul di dekatnya dalam urutan titik kode Unicode. Tidak seperti spam emoji berbasis gambar, urutan ini dapat disalin dan ditempelkan keluar dari browser dan ke aplikasi lain sebagai teks Unicode.
Untuk jenis yang terakhir, skrip pengguna menyertakan ekspresi reguler yang dirancang untuk menangkap urutan Unicode yang kemungkinan akan disalahgunakan oleh pemasar. Regex terlihat seperti ini dalam ES6 Javascript (skrip pengguna menerjemahkan ini ke regex pra-ES6 yang didukung secara luas menggunakan ES6 Regex Transpiler yang luar biasa ):
sumber