Unicode grep para Windows [fechado]

13

Existe um grep compatível com Unicode para Windows de 32 bits?

Jeroen Wiert Pluimers
fonte
1
Você encontrou um que funcionou com Unicode? Não está claro nas respostas se as diferentes ferramentas são compatíveis com Unicode ou não.
Peter Mortensen
1
Eu desisti e usou o built-in busca de Visual Studio (:
Jeroen Wiert Pluimers

Respostas:

8

Para uma ferramenta de linha de comando, consulte a resposta KeyboardMonkey (mas não tenho certeza sobre o suporte a Unicode).

Para uma ferramenta GUI (de código aberto): dnGREP

  • Integração com shell (capacidade de pesquisar no Windows Explorer)
  • Texto sem formatação, expressão regular e pesquisa XPath (incluindo pesquisa sem distinção entre maiúsculas e minúsculas)
  • Pesquisa fonética (usando os algoritmos Bitap e Needleman-Wunch )
  • Arquivo mover / copiar / excluir ações
  • Pesquise dentro de arquivos / documentos do MS Word / documentos em PDF (via plug-ins)
  • Desfazer funcionalidade
  • Integração opcional com o editor de texto (como o Notepad ++ )
  • Marcadores (capacidade de salvar pesquisas de expressões regulares para o futuro)
  • Formulário de teste padrão
  • Destaque do resultado da pesquisa
  • Não requer instalação (pode ser executado a partir de uma unidade USB)

insira a descrição da imagem aqui

Para uma ferramenta GUI mais simples (apenas pesquisa): AstroGrep e para uma ferramenta mais destacada (e cara): PowerGREP

fluxtendu
fonte
De acordo com gratuito do aparelho, "Substituir texto" ecobyte.com/replacetext é outra opção interessante
fluxtendu
Desculpem o necro, mas OBRIGADO !! Desespero essa ferramenta no Windows e esse dnGREP é uma dádiva de Deus!
pepoluan
3

A maioria das versões do Windows inclui o comando "findstr", que funciona como o grep. Eu não sei sobre suas habilidades Unicode, mas, pelo que sei, não deve haver nenhum problema com isso.

Morfildur
fonte
2

Atualização: O GnuWin32 é uma porta dessas ferramentas mantida mais recentemente. (Obrigado Quack)

Aqui está uma lista dos pacotes e para baixar o grep individualmente.

Dê uma olhada no UnxUtils , que também inclui grep. Também os uso no meu PC de trabalho.

invertido
fonte
3
O UnxUtils é antigo e não é suportado - última atualização em 2003. tente o GnuWin32 para obter um conjunto de ferramentas mais recente: gnuwin32.sourceforge.net
quack quixote
1

Sim, como o fluxtendu menciona,

  • O PowerGREP fará tudo isso. Mas é proprietário e custa 149 Euros.
  • O dnGREP também funcionará e possui um recurso semelhante definido gratuitamente.

Contudo,

  • O Cygwin também pode instalar o grep (e muito mais, se você quiser.) Ele fará a pesquisa Unicode com a -Uopção. Eu recomendaria o Cygwin como a solução mais simples se você estiver familiarizado com o Unix grep. Apenas certifique-se de anexar seu PATH e você também pode usá-lo no shell do Windows.
brice
fonte
1

A maneira mais simples de fazer isso é um utilitário do Windows chamado "strings", que faz exatamente o que você procura:

Cordas (Sysinternals)

Basicamente, ele retira todos os caracteres Unicode dos arquivos, para que você possa canalizá-lo para qualquer Windows grepal que você use, seja ele findstr(nativo) ou como eu, o gnuwin32 grep para Windows (faz o que está escrito na lata).

Então você obtém algo como:

strings *.odf | grep -i  "texttosearch"

findstr também funciona para muitas coisas, mas o grep está melhor ao redor.

Some_Guy
fonte
1
Como, exatamente, isso responde à pergunta? O stringsprograma é usado para encontrar cadeias de texto que são misturadas com dados que não são de texto ("binários"); por exemplo, arquivos executáveis. A questão não diz nada sobre a incorporação de cadeias de texto em dados binários. ……………………… E se eu quiser pesquisar em um arquivo de texto Unicode por caracteres como π e ? Eu digitaria strings dissertation | findstr "π"? Lida findstrcom Unicode? Se sim, por que não dizer findstr "π" dissertation, o que foi sugerido há cinco anos? Se não, então o que você ganhou?
G-Man diz 'Reinstate Monica'
bom ponto. Suponho que não corretamente compreender o que o entrevistador era depois
Some_Guy
0

Veja BareGrep (a versão gratuita possui uma tela inicial), que parece ser um grep gráfico bastante completo. A documentação menciona suporte para "Muitos formatos de arquivo", então eu imagino que o Unicode esteja incluído.

insira a descrição da imagem aqui

harrymc
fonte
Tenho certeza de que NÃO suporta Unicode. Eu tentei e não funciona em arquivos UTF-16. Enviei um e-mail para confirmar.
O'Rooney