Perguntas com a marcação «parsing»

14
testes de unidade para um analisador csv

Quais testes devo usar para testar em unidade um analisador csv? Eu tenho um analisador csv simples em c # e quero ter certeza de que tenho uma boa cobertura de teste de unidade de todos os casos comuns (e incomuns) de borda. Quais testes devo usar para identificar possíveis problemas e casos de...

11
Obtendo dados de uma página da Web de maneira estável e eficiente

Recentemente, aprendi que usar uma regex para analisar o HTML de um site e obter os dados necessários não é o melhor curso de ação. Portanto, minha pergunta é simples: qual é a melhor / mais eficiente e uma maneira geralmente estável de obter esses dados? Devo observar que: Não há APIs Não há...

11
Algoritmo para formatar código SQL

Preciso de uma ferramenta (para uso interno) que formate o código SQL (SQL Server / MySQL). Existem várias ferramentas de terceiros e sites on-line que fazem isso, mas não exatamente como eu preciso. Então, eu quero escrever minha própria ferramenta que atenda às minhas necessidades. Primeira...

11
Técnicas para analisar XML

Eu sempre achei o XML um tanto complicado de processar. Não estou falando sobre a implementação de um analisador XML: estou falando sobre o uso de um analisador baseado em fluxo existente, como um analisador SAX, que processa o nó XML por nó. Sim, é realmente fácil aprender as várias APIs para...

9
Análise de idioma para encontrar palavras importantes

Estou procurando informações e teorias sobre como abordar um tópico lexical. Digamos que eu tenha uma coleção de strings, que podem ser apenas uma sentença ou potencialmente várias sentenças. Eu gostaria de analisar essas strings e extrair as palavras mais importantes, talvez com uma pontuação que...

9
Melhor maneira de analisar um arquivo

Estou tentando encontrar uma solução melhor para fazer um analisador para alguns dos famosos formatos de arquivo existentes, como: EDIFACT e TRADACOMS . Se você não estiver familiarizado com esses padrões, verifique este exemplo da Wikipedia: Veja abaixo um exemplo de uma mensagem EDIFACT usada...