Quais recursos são geralmente usados ​​nas árvores Parse no processo de classificação na PNL?

13

Estou explorando diferentes tipos de estruturas de árvores de análise. As duas estruturas de árvore de análise amplamente conhecidas são a) árvore de análise baseada em constituintes eb) estruturas de árvore de análise baseadas em dependência.

Eu sou capaz de usar gerar dois tipos de estruturas de árvore de análise usando o pacote Stanford NLP. No entanto, não tenho certeza de como usar essas estruturas em árvore para minha tarefa de classificação.

Por exemplo, se eu quiser fazer uma análise de sentimentos e desejar categorizar o texto em classes positivas e negativas, que recursos posso derivar das estruturas de árvore de análise para minha tarefa de classificação?

trabalhando
fonte

Respostas:

9

Usando uma árvore de análise, você divide sua sentença em partes. Suponha que, no exemplo da análise de sentimentos, você possa usar essas partes para atribuir um sentimento positivo / negativo a cada parte e, em seguida, obter o efeito cumulativo dessas partes.

análise de sentimentos

Esta imagem irá ajudá-lo a entender mais. A primeira metade tem um sentimento negativo (principalmente por causa da palavra "seco"), mas por causa da palavra "mas" e pelo uso da palavra "apreciado", o sentimento negativo é transformado em um sentimento positivo.

Quanto ao seu uso, você pode simplesmente gerar uma representação vetorial de palavras das palavras individuais na frase e usar neurônios no lugar dos nós pais. Cada neurônio deve ser conectado a outro neurônio através de pesos. Todos os nós das folhas serão representações do vetor de palavras das palavras da frase. O neurônio pai superior (neste caso, o símbolo azul + superior) deve gerar um sentimento positivo / negativo de acordo com a sentença. Essa estrutura em árvore pode ser treinada de maneira supervisionada.

Leia este documento para obter mais informações.

Créditos da imagem: cs224.stanford.edu

Azrael
fonte
1

Penso que as dependências podem ser usadas para melhorar a precisão do seu classificador de sentimentos. Considere os seguintes exemplos:

E1: Bill não é um cientista

e suponha que o token "cientista" tenha um sentimento positivo em um domínio específico.

Conhecendo a dependência neg (cientista, não), podemos ver que o exemplo acima tem um sentimento negativo. Sem conhecer essa dependência, provavelmente classificaríamos a sentença como positiva.

Outros tipos de dependências podem ser usados ​​provavelmente da mesma maneira para melhorar a precisão dos classificadores.

Pasmod Turing
fonte