Perguntas com a marcação «parsing»

92
Como analiso uma página HTML com Node.js

Eu preciso analisar (lado do servidor) grandes quantidades de páginas HTML. Todos concordamos que regexp não é a melhor opção aqui. Parece-me que o javascript é a maneira nativa de analisar uma página HTML, mas essa suposição se baseia no código do lado do servidor com toda a capacidade DOM que o...

90
O que torna o Java mais fácil de analisar do que o C?

Estou familiarizado com o fato de que as gramáticas de C e C ++ são sensíveis ao contexto e , em particular, você precisa de um "hack lexer" em C. Por outro lado, tenho a impressão de que você pode analisar Java apenas com 2 tokens de look-ahead, apesar da similaridade considerável entre os dois...

86
Python: Como determinar a linguagem?

Eu quero pegar isso: Input text: "ру́сский язы́к" Output text: "Russian" Input text: "中文" Output text: "Chinese" Input text: "にほんご" Output text: "Japanese" Input text: "العَرَبِيَّة" Output text: "Arabic" Como posso fazer isso em python? Obrigado....

9
Interrompendo a gramática Raku na EOS (fim da string)

No processo de escrever um tradutor de uma linguagem musical para outra (ABC para Alda) como uma desculpa para aprender a capacidade DSL do Raku, notei que não parece haver uma maneira de encerrar a .parse! Aqui está o meu código de demonstração abreviado: #!/home/hsmyers/rakudo741/bin/perl6 use...

8
Como posso extrair um número inteiro de dentro de uma string?

Estou trabalhando em uma tarefa e, como parte dela, preciso extrair o número inteiro de uma string. Eu tentei usar a atoi()função, mas ela sempre retorna a 0, então mudei para strtol(), mas ainda retorna a 0. O objetivo é extrair os números inteiros da string e passá-los como argumentos para uma...