Para experimentar, gostaríamos de usar o Emoji incorporado em muitos Tweets como dados básicos de treinamento / verdade para uma análise quantitativa simples de senações. Os tweets geralmente não são estruturados para que a PNL funcione bem.
De qualquer forma, existem 722 Emoji no Unicode 6.0 e provavelmente outros 250 serão adicionados no Unicode 7.0.
Existe um banco de dados (como, por exemplo, o SentiWordNet) que contém anotações de sentimentos para eles?
(Observe que o SentiWordNet também permite significados ambíguos . Considere, por exemplo , engraçado , que não é apenas positivo: "isso tem um gosto engraçado" provavelmente não é positivo ... o mesmo vale ;-)
por exemplo. Mas não acho que isso seja mais difícil. para Emoji do que para palavras comuns ...)
Além disso, se você tiver experiência em usá-los para análise de sentimentos, ficaria interessado em ouvir.
fonte
Respostas:
Um total de 972 emojis não é tão grande assim para não poder rotulá-los manualmente, mas duvido que eles funcionem como uma boa verdade. Fontes como o Twitter estão cheias de ironia, sarcasmo e outras situações complicadas, onde símbolos emocionais (como emoji ou emoticon) significam algo diferente da interpretação normal. Por exemplo, alguém pode escrever "xxx enganou seus clientes e agora eles são enganados! Ha ha ha!: D". Esse é definitivamente um comentário negativo, mas o autor está feliz em ver a empresa xxx com problemas e, portanto, adiciona emoticons positivos. Esses casos não são tão frequentes, mas definitivamente não são adequados para a verdade básica.
Uma abordagem muito mais comum é usar o emoticon como uma semente para coletar o conjunto de dados real . Por exemplo, neste artigo, os autores usam tags de emoticons e hash emocional para obter o léxico de palavras úteis para classificação adicional.
fonte
Achei este repositório do Github útil (um bom começo): https://github.com/wooorm/emoji-emotion Lista de emoticons classificados para valência com um número inteiro entre menos cinco (negativo) e mais cinco (positivo).
Consulte a lista de emojis unicode suportados: https://github.com/wooorm/emoji-emotion/blob/master/Support.md
fonte