Existe um software que fará a análise de palavras-chave em um lote de arquivos do Microsoft Word? Em outras palavras, eu simplesmente gostaria de uma contagem de palavras em todas as palavras usadas. O objetivo é identificar palavras-chave como base para a criação de uma taxonomia.
microsoft-word
microsoft-office
word-count
mmcglynn
fonte
fonte
Respostas:
Eu uso um script Python que usa o
docx.py
módulo (ver Aqui ) para ler arquivos do Word e processar as palavras individuais para uma tarefa relacionada. Os bits de chave estão no código a seguir (que apenas lê um arquivo .docx dado como o primeiro argumento de linha de comando, mas pode ser facilmente expandido para contar palavras em muitos arquivos:fonte
E se WordStat ?
fonte