Recentemente, comecei a experimentar o processamento de linguagem natural (NLP) usando o CoreNLP de Stanford e estou me perguntando quais são algumas das maneiras padrão de armazenar dados analisados de PNL para algo como um aplicativo de mineração de texto?
Uma maneira que pensei que poderia ser interessante é armazenar os filhos como uma lista de adjacências e fazer bom uso de consultas recursivas (o Postgres suporta isso e achei que funciona muito bem).
Mas suponho que provavelmente existem muitas maneiras padrão de fazer isso, dependendo do tipo de análise que está sendo feita e que foi adotada por pessoas que trabalham no campo ao longo dos anos. Então, quais são as estratégias de persistência padrão para os dados analisados da PNL e como eles são usados?
fonte