Oi eu tenho uma folha de excel que foi exportada diretamente de um banco de dados. Isso inclui várias strings, algumas das quais são tags html. Quero excluir todas as tags de link, por exemplo
(<a href="mylink" target="_blank">
mas mantenha todas as outras cordas intactas. Eu estava tentando fazer isso com um encontrar e substituir, mas eu não consigo descobrir um Regex que vai fazer isso e também trabalhar no excel. Eu vasculhei a rede, mas não consegui encontrar uma solução para isso.
Se eu fizer isso
<a href*>
Ele excluirá quase todo o conteúdo da planilha porque vai para a última tag de fechamento que pode encontrar. Existe uma maneira de refazer minha pesquisa para que ela receba a próxima tag de fechamento e não a última?
microsoft-excel
regex
Samuel
fonte
fonte
Respostas:
O mais fácil, ou seja, apenas uma boa maneira que conheço é o uso do Lynx, o antigo navegador de modo de texto:
lynx --dump URL_or_HTML-file
- mas, então, você precisa encontrar uma maneira de executá-lo no Windows (por exemplo, cygwin ou WSL).
Oh ... mais uma coisa: você deve perceber; o que você está pedindo é essencialmente um navegador da web em toda a sua glória.
O lince é isso, mesmo com suas limitações e defeitos inerentes.
Exemplo:
fonte