Qual é a diferença entre um analisador de constituency e um analisador de dependência ? Quais são os diferentes usos dos dois?
Uma árvore de análise de constituintes divide um texto em subfrases. Os não terminais na árvore são tipos de frases, os terminais são as palavras na frase e as arestas não têm rótulos. Para uma frase simples "John vê Bill", uma análise do distrito eleitoral seria:
Sentence
|
+-------------+------------+
| |
Noun Phrase Verb Phrase
| |
John +-------+--------+
| |
Verb Noun Phrase
| |
sees Bill
Uma análise de dependência conecta palavras de acordo com seus relacionamentos. Cada vértice na árvore representa uma palavra, nós filhos são palavras que dependem do pai e as arestas são rotuladas pelo relacionamento. Uma análise de dependência de "John vê Bill" seria:
sees
|
+--------------+
subject | | object
| |
John Bill
Você deve usar o tipo de analisador que o aproxima de seu objetivo. Se você estiver interessado em sub-frases dentro da frase, provavelmente deseja que a análise constituinte. Se você estiver interessado nas relações de dependência entre as palavras, provavelmente deseja a análise de dependência.
O analisador Stanford pode fornecer qualquer um deles ( demonstração online ). Na verdade, a maneira como realmente funciona é sempre analisar a frase com o analisador de constituintes e, em seguida, se necessário, realiza uma transformação determinística (baseada em regras) na árvore de análise de constituintes para convertê-la em uma árvore de dependência.
Mais pode ser encontrado aqui: