extrair parte da string usando sed

9
ls lib/oracle-11.2.0.3.0.txt | sed 's/lib.\([oracle.*]\)\.txt/\1/'

Ele está dando a string inteira em vez de apenas a parte do oracle até .txt O que estou fazendo de errado?

Posso fazer isso usando o awk da seguinte forma, mas não sei por que o sed não está dando o resultado desejado.

echo "lib/oracle-11.2.0.3.0.txt" | awk -F/ '{print substr($2,1,index($0,".txt")-1);}'
would_like_to_be_anon
fonte

Respostas:

12

[oracle.*]significa "um dos personagens o, r, a, c, l, e, ., ou *". Conseqüentemente, seu regex corresponderá apenas a algo como

lib+c.txt

e não o nome do arquivo real que você está passando. Se você remover o [e ]do regex, ele funcionará bem:

ls lib/oracle-11.2.0.3.0.txt | sed 's/lib.\(oracle.*\)\.txt/\1/'

No entanto, uma maneira muito mais simples de fazer isso é

basename lib/oracle-11.2.0.3.0.txt .txt

ou, se você realmente deseja que o arquivo venha stdin:

ls lib/oracle-11.2.0.3.0.txt | xargs -I{} basename {} .txt
rici
fonte
6

Aqui estão mais algumas maneiras de fazer isso:

  1. Perl

    echo "lib/oracle-11.2.0.3.0.txt" | perl -pe 's/.+(oracle.+)\.txt/$1/'
    
  2. sed

    echo "lib/oracle-11.2.0.3.0.txt" | sed 's/.*\(oracle.*\)\.txt/\1/'
    
  3. cut

    echo "lib/oracle-11.2.0.3.0.txt" | cut -d'/' -f 2 | cut -d '.' -f 1-5
    
  4. basename e bash

    echo "lib/oracle-11.2.0.3.0.txt" | while read n; do 
      echo $(basename ${n/.txt//}); 
    done
    
terdon
fonte
1

Que tal usar cut

echo "lib/oracle-11.2.0.3.0.txt" | cut -c5-19
jrnetclueless
fonte