Quais são os pacotes de mineração de texto para R e existem outros programas de mineração de texto de código aberto?

12

Você pode recomendar um pacote de mineração de texto no R que possa ser usado em grandes volumes de dados?
Em segundo lugar, existe uma GUI disponível para qualquer um dos pacotes de mineração de texto no R?
Em terceiro lugar, existe outro programa de mineração de texto de código aberto fácil e intuitivo de usar?


fonte
@mbq: bem, "existe um pacote de mineração de texto de código aberto com uma GUI?" provavelmente cobriria todas as três perguntas muito bem, meio que já é uma pergunta ...
naught101

Respostas:

4

Aqui estão mais dois projetos integrados:

  • Python Natural Language Toolkit (instalação fácil, boa documentação)
  • Java MALLET (sem experiência, mas parece promissor; incluído no link fornecido por @Nick)

Ambos são softwares de código aberto.

chl
fonte
3

Claro, RapidMiner com a extensão de mineração de texto.

Existem muitos vídeos que mostram como isso é feito.


fonte
2
aqui é uma série de vídeos em 5 partes: vancouverdata.blogspot.com/2010/11/...
Neil McGuigan
1

GATE é muito abrangente. Também permite trabalhar com diferentes idiomas e possui um editor de ontologia.

Ralph Winters
fonte
0

Andrew McCallum (UMass) tem alguns projetos de software relacionados à PNL disponíveis em sua página da web . Estes estão todos em Java (eu acho) com código fonte disponível.

usuario
fonte