Ferramenta de linha de comando para pesquisar arquivos docx

9

Existe uma ferramenta de linha de comando para pesquisar texto em um arquivo docx? Eu tentei grep, mas não funciona com docx, embora funcione bem com arquivos txt e xml. Eu poderia converter o docx em txt primeiro, mas prefiro uma ferramenta que funcione diretamente em arquivos docx. Preciso da ferramenta para trabalhar com Cygwin.

OP edit: Mais tarde, descobri que a maneira mais fácil de obter o grep é converter esses docx em txt e depois grep sobre eles.

Gob00st
fonte
Resposta relacionada ao stackoverflow .
Jw013 6/01/12
Eu me livrei da parte do DOS, já que isso é fora de tópico aqui
Michael Mrozek

Respostas:

3

Conheço várias ferramentas de indexação compatíveis com documentos do Word. Essas ferramentas permitem indexar documentos e, em seguida, pesquisar com eficiência palavras no índice. Eles não permitem pesquisas de texto completo.

Gilles 'SO- parar de ser mau'
fonte
1

DOCx está compactado e não é um formato de texto. Então, o que você precisa é primeiro um conversor . Depois disso, você pode usar o findcomando no (s) arquivo (s) convertido (s).

Nils
fonte
Ou você pode usar uma ferramenta de pesquisa que pode ler dentro de arquivos compactados. Na sua última frase, suponho que você quis dizer grep?
Gilles 'SO- stop be evil'
@Gilles - veja o título original da pergunta antes de Michael editá-la. Essa parecia ser uma pergunta sobre o DOS (e eu a sinalizei fora de tópico).
Nils