Eu tenho um arquivo de texto muito longo (a partir daqui ) que deve conter 6 caracteres hexadecimais e, em seguida, uma 'quebra' (que aparece como um caractere e não parece ser exibida corretamente na marcação de código abaixo) seguida por algumas palavras:
00107B Cisco Systems, Inc
00906D Cisco Systems, Inc
0090BF Cisco Systems, Inc
5080 Cisco Systems, Inc
0E+00 ASUSTek COMPUTER INC.
000C6E ASUSTek COMPUTER INC.
001BFC ASUSTek COMPUTER INC.
001E8C ASUSTek COMPUTER INC.
0015F2 ASUSTek COMPUTER INC.
2354 ASUSTek COMPUTER INC.
001FC6 ASUSTek COMPUTER INC.
60182E ShenZhen Protruly Electronic Ltd co.
F4CFE2 Cisco Systems, Inc
501CBF Cisco Systems, Inc
Eu olhei em volta e não consigo ver algo que funcionaria nessa situação. Minha pergunta é: como posso usar grep
/ sed
/ awk
/ perl
para excluir todas as linhas deste arquivo de texto que não iniciam exatamente com 6 caracteres hexadecimais e, em seguida, um 'intervalo'?
PS Para pontos de bônus, qual é a melhor maneira de classificar o arquivo alfabeticamente e numericamente de acordo com os caracteres hexadecimais (ou seja, 000000
-> FFFFFF
)? Devo apenas usar sort
?
E, para completar, você também pode fazer isso com o grep:
Essa expressão grep estendida procura exatamente 6 dígitos hexadecimais no início de cada linha, seguida imediatamente por um limite que não seja de espaço em branco para espaço em branco (
\b
).fonte