padrão de correspondência sed N vezes

14

Eu quero dividir um arquivo em pedaços com 2 palavras cada.

$cat tmp
word1 word2 word3 word4 word5 word6 word7
$sed -e 's/word. word. /&\n/g' tmp
word1 word2 
word3 word4 
word5 word6 
word7
$sed -e 's/word. \{2\}/&\n/g' tmp
word1 word2 word3 word4 word5 word6 word7

Eu esperava que o último comando desse o mesmo resultado que o anterior. O que está errado?

user13107
fonte

Respostas:

17

Desculpe, parece que eu descobri isso logo após a postagem.

Precisa ser

sed -e 's/\(word. \)\{2\}/&\n/g' tmp

Aparentemente, os colchetes são necessários para permitir que o sed aplique a condição {2} em todo o padrão word.e não apenas no espaço anterior.

user13107
fonte
3
ou usosed -E 's/(word. ){2}/&\n/g' tmp
Cyrus
1

Outra maneira de sed:

$ sed 's/ /\x1&\x2/g; s/\([^\x1]*[\x1][^\x2]*[\x2][^\x1]*\)[\x1][^\x2]*[\x2]/\1\
/g; s/[\x1\x2]//g'
cuonglm
fonte
parece muito complicado. o que é \x?
user13107
1

Para o caso geral de combinar N vezes:

$ perl -ple '$N=3;s/(\S+ ){$N}\K/\n/g' tmp
word1 word2 word3 
word4 word5 word6 
word7
Joseph R.
fonte