Substitua apenas alguns grupos pelo Regex

190

Vamos supor que eu tenha o seguinte regex:

-(\d+)-

e quero substituir, usando C #, o Grupo 1 (\d+)por AA, para obter:

-AA-

Agora estou substituindo-o usando:

var text = "example-123-example";
var pattern = @"-(\d+)-";
var replaced = Regex.Replace(text, pattern, "-AA-"); 

Mas eu realmente não gosto disso, porque se eu alterar o padrão para corresponder _(\d+)_, também terei que alterar a string de substituição _AA_, e isso é contrário ao princípio DRY.

Estou procurando algo como:

Mantenha o texto correspondente exatamente como está, mas altere o Grupo 1 por this texte o Grupo 2 por another text...

Edit:
Isso foi apenas um exemplo. Estou apenas procurando uma maneira genérica de fazer o que eu disse acima.

Deve funcionar para:

anything(\d+)more_text e qualquer padrão que você possa imaginar.

Tudo o que quero fazer é substituir apenas grupos e manter o resto da partida.

Oscar Mederos
fonte

Respostas:

306

Uma boa idéia poderia ser encapsular tudo dentro dos grupos, não importa se é necessário identificá-los ou não. Dessa forma, você pode usá-los em sua string de substituição. Por exemplo:

var pattern = @"(-)(\d+)(-)";
var replaced = Regex.Replace(text, pattern, "$1AA$3"); 

ou usando um MatchEvaluator:

var replaced = Regex.Replace(text, pattern, m => m.Groups[1].Value + "AA" + m.Groups[3].Value);

Outra maneira, um pouco confusa, poderia estar usando um lookbehind / lookahead:

(?<=-)(\d+)(?=-)

bluepnume
fonte
17
Editei sua resposta para fornecer mais informações, mas o que você disse está totalmente correto. Não sei como eu perdi que eu poderia colocar tudo dentro de grupos, não importa se vai usá-los ou não :) . Na minha opinião, essa solução é muito melhor e mais limpa do que usar lookahead e lookbehinds.
Oscar Mederos
pequeno erro de digitação, o seu padrão de substituição deve ser de US $ 1AA $ 3
Myster
1
Para que isso funcione, eu tive que adicionar .Valueao m.Groups[1]etc.
jbeldock
10
Também vale a pena notar - se o texto de substituição começar com um número, a primeira solução ("$ 1AA $ 3") não funcionará conforme o esperado!
Bertie
2
@OscarMederos, você também pode usar grupos que não capturam - bom para grupos que você não usa. Em (?:foo)(bar), $1irá substituir bar. mais detalhes
Patrick
34

Você pode fazer isso usando lookahead e lookbehind :

var pattern = @"(?<=-)\d+(?=-)";
var replaced = Regex.Replace(text, pattern, "AA"); 
LukeH
fonte
19

Eu também precisava disso e criei o seguinte método de extensão:

public static class RegexExtensions
{
    public static string ReplaceGroup(
        this Regex regex, string input, string groupName, string replacement)
    {
        return regex.Replace(
            input,
            m =>
            {
                var group = m.Groups[groupName];
                var sb = new StringBuilder();
                var previousCaptureEnd = 0;
                foreach (var capture in group.Captures.Cast<Capture>())
                {
                    var currentCaptureEnd =
                        capture.Index + capture.Length - m.Index;
                    var currentCaptureLength =
                        capture.Index - m.Index - previousCaptureEnd;
                    sb.Append(
                        m.Value.Substring(
                            previousCaptureEnd, currentCaptureLength));
                    sb.Append(replacement);
                    previousCaptureEnd = currentCaptureEnd;
                }
                sb.Append(m.Value.Substring(previousCaptureEnd));

                return sb.ToString();
            });
    }
}

Uso:

var input = @"[assembly: AssemblyFileVersion(""2.0.3.0"")][assembly: AssemblyFileVersion(""2.0.3.0"")]";
var regex = new Regex(@"AssemblyFileVersion\(""(?<version>(\d+\.?){4})""\)");


var result = regex.ReplaceGroup(input , "version", "1.2.3");

Resultado:

[assembly: AssemblyFileVersion("1.2.3")][assembly: AssemblyFileVersion("1.2.3")]
Daniel Hilgarth
fonte
13

Se você não quiser alterar seu padrão, poderá usar as propriedades Índice e Comprimento do Grupo de um grupo correspondente.

var text = "example-123-example";
var pattern = @"-(\d+)-";
var regex = new RegEx(pattern);
var match = regex.Match(text);

var firstPart = text.Substring(0,match.Groups[1].Index);    
var secondPart = text.Substring(match.Groups[1].Index + match.Groups[1].Length);
var fullReplace = firstPart + "AA" + secondPart;
Dick Verweij
fonte
Observe que isso pressupõe e só funcionará para a primeira ocorrência da partida.
precisa
5

Aqui está outra boa opção de limpeza que não requer alteração no seu padrão.

        var text = "example-123-example";
        var pattern = @"-(\d+)-";

        var replaced = Regex.Replace(text, pattern, (_match) =>
        {
            Group group = _match.Groups[1];
            string replace = "AA";
            return String.Format("{0}{1}{2}", _match.Value.Substring(0, group.Index - _match.Index), replace, _match.Value.Substring(group.Index - _match.Index + group.Length));
        });
curlyhairedgenius
fonte
0

siga a codificação abaixo para obter a substituição do grupo separado.

new_bib = Regex.Replace(new_bib, @"(?s)(\\bibitem\[[^\]]+\]\{" + pat4 + @"\})[\s\n\v]*([\\\{\}a-zA-Z\.\s\,\;\\\#\\\$\\\%\\\&\*\@\\\!\\\^+\-\\\=\\\~\\\:\\\" + dblqt + @"\\\;\\\`\\\']{20,70})", delegate(Match mts)
                    {
                           var fg = mts.Groups[0].Value.ToString(); 
                           var fs = mts.Groups[1].Value.ToString();
                           var fss = mts.Groups[2].Value.ToString();
                               fss = Regex.Replace(fss, @"[\\\{\}\\\#\\\$\\\%\\\&\*\@\\\!\\\^+\-\\\=\\\~\\\:\\\" + dblqt + @"\\\;\\\`\\\']+", "");
                           return "<augroup>" + fss + "</augroup>" + fs;
                    }, RegexOptions.IgnoreCase);
BalaS
fonte