Existe uma ferramenta de linha de comando para pesquisar texto em um arquivo docx? Eu tentei grep
, mas não funciona com docx, embora funcione bem com arquivos txt e xml. Eu poderia converter o docx em txt primeiro, mas prefiro uma ferramenta que funcione diretamente em arquivos docx. Preciso da ferramenta para trabalhar com Cygwin.
OP edit: Mais tarde, descobri que a maneira mais fácil de obter o grep é converter esses docx em txt e depois grep sobre eles.
grep
search
cygwin
microsoft-word
Gob00st
fonte
fonte
Respostas:
Conheço várias ferramentas de indexação compatíveis com documentos do Word. Essas ferramentas permitem indexar documentos e, em seguida, pesquisar com eficiência palavras no índice. Eles não permitem pesquisas de texto completo.
fonte
DOCx está compactado e não é um formato de texto. Então, o que você precisa é primeiro um conversor . Depois disso, você pode usar o
find
comando no (s) arquivo (s) convertido (s).fonte
grep
?Você já viu o ninja do openoffice ?
(não sabe sobre o suporte cygwin)
fonte