Análise de palavras-chave do Microsoft Office [fechada]

0

Existe um software que fará a análise de palavras-chave em um lote de arquivos do Microsoft Word? Em outras palavras, eu simplesmente gostaria de uma contagem de palavras em todas as palavras usadas. O objetivo é identificar palavras-chave como base para a criação de uma taxonomia.

mmcglynn
fonte
Isso é muito aberto: que tipo de análise você queria?
Clare Macrae
pergunta atualizada para ser mais específica.
mmcglynn
Duplicação possível de: superuser.com/questions/251324/…
fixer1234

Respostas:

1

Eu uso um script Python que usa o docx.py módulo (ver Aqui ) para ler arquivos do Word e processar as palavras individuais para uma tarefa relacionada. Os bits de chave estão no código a seguir (que apenas lê um arquivo .docx dado como o primeiro argumento de linha de comando, mas pode ser facilmente expandido para contar palavras em muitos arquivos:

from docx import *
import sys

try:
    document = opendocx(sys.argv[1])
except:
    print('Could not open '+sys.argv[1])
    exit()

## Fetch all the text out of the document       
paratextlist = getdocumenttext(document)    

count = {}
for line in paratextlist:
    for word in line.rstrip().split():
        count{word} = count.get(word,0) + 1
Simon
fonte
0

E se WordStat ?

rlb.usa
fonte
Exatamente certo. Bastante caro embora em ~ $ 3000.
mmcglynn