Eu estava vasculhando minha pasta de spam (o que raramente faço, porque o Gmail raramente tem falsos positivos) e notei algo interessante:
Algo como mais da metade das mensagens tem pelo menos um emoji animado no assunto.
Nenhum dos meus amigos usaria essa porcaria. Nenhuma empresa válida com a qual eu faria negócios jamais faria isso também.
Como posso criar um filtro para, talvez, excluir automaticamente mensagens com emoticons animados no assunto?
Usando a pista de jamesmstone abaixo, tentei pesquisar com subject:=?UTF-8?
e subject:"=?UTF-8?"
e várias outras permutações, mas nenhuma funcionou.
Aqui está um exemplo de conjunto de cabeçalhos de uma dessas pilhas fumegantes:
Delivered-To: [redacted]@gmail.com
Received: by 10.107.28.200 with SMTP id c191csp1104992ioc;
Sun, 24 Jan 2016 19:07:16 -0800 (PST)
X-Received: by 10.107.38.5 with SMTP id m5mr15068933iom.15.1453691236564;
Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Return-Path: <[email protected]>
Received: from mythirdxyz.xyz ([2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11])
by mx.google.com with ESMTP id o10si8722554igw.41.2016.01.24.19.07.15
for <[redacted]@gmail.com>;
Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Received-SPF: pass (google.com: domain of [email protected] designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) client-ip=2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11;
Authentication-Results: mx.google.com;
spf=pass (google.com: domain of [email protected] designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) [email protected];
dkim=pass [email protected];
dmarc=pass (p=REJECT dis=NONE) header.from=mythirdxyz.xyz
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=mythirdxyz.xyz;
[email protected]; q=dns/txt; s=default; t=1453691229;
bh=GuM9JCP4yh7WfVbRBortR7UAr6DAtlgy0oTCna0iWQk=; h=MIME-Version :
Content-Type : Content-Transfer-Encoding : To : From : Subject : Date :
Message-ID : From : Subject : Date;
b=e/zS14UB4o5MhYlfbpsy0h2G/oZyoC5H3ouyhNh13zcSHSNXzI6uvJpIy9a+za2ng26Xe2
NfAI7nenAMCdHJSGF4yfmtTi3+XrR2MqQPHQ1fzTXGhRy/ktCj4tEqt7DhSxnRCqkYFUNaLA
wh3FMLr6IxPi2Z7xUXm3JBffhDcSU=
MIME-Version: 1.0
Content-Type: text/html; charset="utf-8"
Content-Transfer-Encoding: base64
To: [redacted]@gmail.com
From: "APPROVAL DEPARTMENT" <[email protected]>
Subject: =?utf-8?q?=F3=BE=93=A0_Personal_loan_as_soon_as_tomorrow_=F3=BE=93=A0?=
Date: Sun, 24 Jan 2016 19:07:09 -0800
Message-ID: <[email protected]>
gmail
gmail-filters
emoji
cerveja
fonte
fonte
goomoji
...Respostas:
Resposta curta
Em vez de usar os Filtros do Gmail que dependem do recurso de pesquisa do Gmail para pesquisar os emojis codificados nas mensagens originais , crie um script usando o método GmailMessage :: getRawContent () do Script do Google Apps para processar as mensagens.
Perguntas relacionadas
A seguir, estão links para respostas a perguntas semelhantes neste site, incluindo scripts usando o método referido.
fonte
Eu criei um script do Google Apps para esses fins.
Está no Github: https://github.com/spamzero/spamzero
Ele permite que você crie todos os tipos de regras avançadas que podem ser comparadas à sua pasta de mensagens de spam, para que as mensagens definitivamente spam sejam limpas automaticamente.
fonte
Isso não é exatamente o que você está solicitando (filtrando os emojis em si e não as mensagens com emojis), mas você pode encontrar parte do conteúdo útil para criar um melhor filtro de mensagens.
Agora existe um script de usuário de código-fonte aberto Greasemonkey / Tampermonkey / Violentmonkey para livrar-se daquelas baratas visuais irritantes (apenas os personagens, não as próprias mensagens):
Assunto do Gmail Emoji Roach Motel
Olhando a fonte desse script , você verá que existem dois tipos gerais de baratas de emoji que você encontrará em e-mails de profissionais de marketing abusivos (atualmente, infelizmente, incluindo eBay e Amazon):
Baratas baseadas em imagem HTML (incluindo as horríveis animadas) aka goomoji
Baratas Unicode: ainda existem muitos emojis (e outras sequências Unicode gerando imagens) que os spammers e outros profissionais de marketing antigos estão começando a usar nas linhas de assunto do email e que o gmail não converte em imagens HTML. Em alguns navegadores, eles aparecem em negrito e coloridos, o que é quase tão ruim quanto a animação. Os navegadores também podem optar por animá-los, mas não sei se existem. Essas seqüências Unicode são exibidas pelo navegador como texto Unicode; portanto, a aparência exata (colorida ou não, animada ou não, ...) depende de qual sistema de renderização de texto o navegador está usando. A aparência de um determinado emoji Unicode também depende de qualquer seletor de variação Unicode e modificador de emojique aparecem perto dele na sequência de pontos de código Unicode. Diferentemente do spam emoji baseado em imagem, essas seqüências podem ser copiadas e coladas do navegador e em outros aplicativos como texto Unicode.
Para o último tipo, o userscript inclui uma expressão regular projetada para capturar as seqüências Unicode que provavelmente serão abusadas pelos profissionais de marketing. A regex se parece com isso no Javascript ES6 (o script do usuário traduz isso para a regex pré-ES6 amplamente suportada, usando o incrível Transpiler ES6 Regex ):
fonte