Você pode recomendar um pacote de mineração de texto no R que possa ser usado em grandes volumes de dados?
Em segundo lugar, existe uma GUI disponível para qualquer um dos pacotes de mineração de texto no R?
Em terceiro lugar, existe outro programa de mineração de texto de código aberto fácil e intuitivo de usar?
12
Respostas:
Consulte a exibição de tarefas CRAN sobre processamento de linguagem natural, que inclui, entre outros, o pacote tm já mencionado por Josh.
fonte
Veja o pacote tm e esta apresentação de Stefan Theussl, apresentada na conferência de R / Finance de 2010 .
fonte
Aqui estão mais dois projetos integrados:
Ambos são softwares de código aberto.
fonte
Claro, RapidMiner com a extensão de mineração de texto.
Existem muitos vídeos que mostram como isso é feito.
fonte
GATE é muito abrangente. Também permite trabalhar com diferentes idiomas e possui um editor de ontologia.
fonte
Andrew McCallum (UMass) tem alguns projetos de software relacionados à PNL disponíveis em sua página da web . Estes estão todos em Java (eu acho) com código fonte disponível.
fonte
Além da exibição de tarefas CRAN sobre processamento de linguagem natural mencionada por Dirk, existem os pacotes quanteda e NLP .
fonte