Usando várias letras como um todo para delimar algum texto

0

Eu tenho um arquivo html, que contém muitos / lt; | ^, alguns textos ao lado de cabeçalhos de lixo, palavras, etc. Eu quero extrair alguns textos entre um conjunto de letras, como "nbsp" e um pipe "|". Eu perco informações se eu usar "delims = nbsp", já que os delims as consideram "n", "b", "s" e "p". Como devo abordar o problema e como extrair vários textos?

Exemplo de texto:

garbage nbsp; SOME_TEXT_1 | garbage
garbage nbsp; SOME_TEXT_2 | garbage
garbage nbsp; SOME_TEXT_3 | garbage
Wajdet
fonte

Respostas:

0

Se o texto for realmente tão simples quanto o seu exemplo, isso o fará;

for /f "delims=^|; tokens=2" %a in (garbage.txt) do echo %a

Se o texto ao redor contiver mais pontos-e-vírgulas, provavelmente será mais fácil obter uma versão do sed ou do awk para o windows. Ou qualquer editor de texto decente, se for um trabalho único.

Berend
fonte