Perguntas com a marcação «text-mining»

8
Erro R usando o pacote tm (mineração de texto)

Estou tentando usar o pacote tm para converter um vetor de seqüências de texto em um elemento corpus. Meu código se parece com isso Corpus(d1$Yes) onde d1$Yesé um fator com 124 níveis, cada um contendo uma sequência de texto. Por exemplo, d1$Yes[246] = "So we can get the boat out!" Estou...

6
Comparando dois Corpora usando o Modelo de Tópico

Quero comparar dois corpora (duas coleções diferentes de textos) usando a Modelagem de Tópicos. Treinei o modelo separadamente nas duas coleções e correspondi manualmente a tópicos semelhantes com base em suas palavras frequentes. Fiquei me perguntando se existe uma maneira sistemática de comparar...