Como obter a enésima ocorrência em uma string?

104

Eu gostaria de obter a posição inicial da 2ndocorrência de ABCcom algo assim:

var string = "XYZ 123 ABC 456 ABC 789 ABC";
getPosition(string, 'ABC', 2) // --> 16

Como você faria?

Adão
fonte
A segunda ocorrência ou a última? :)
Ja͢ck
Desculpe pela confusão, não estou procurando o último índice. Estou procurando a posição inicial de nthocorrência, neste caso a segunda.
Adam

Respostas:

158

const string = "XYZ 123 ABC 456 ABC 789 ABC";

function getPosition(string, subString, index) {
  return string.split(subString, index).join(subString).length;
}

console.log(
  getPosition(string, 'ABC', 2) // --> 16
)

Denys Séguret
fonte
26
Na verdade, não gosto dessa resposta. Dada uma entrada de comprimento ilimitado, ele cria desnecessariamente uma matriz de comprimento ilimitado e, em seguida, joga fora a maior parte. Seria mais rápido e eficiente apenas usar iterativamente o fromIndexargumento paraString.indexOf
Alnitak
3
function getPosition(str, m, i) { return str.split(m, i).join(m).length; }
cópia de
9
Eu teria ficado bem se você especificasse o que cada parâmetro significa.
Antes de
1
@Foreever Eu simplesmente implementei a função definida por OP
Denys Séguret
5
Isso fornecerá o comprimento da string se houver < iocorrências de m. Ou seja, getPosition("aaaa","a",5)4, como dá getPosition("aaaa","a",72)! Acho que você quer -1 nesses casos. var ret = str.split(m, i).join(m).length; return ret >= str.length ? -1 : ret;Você também pode querer pegar i <= 0comreturn ret >= str.length || i <= 0 ? -1 : ret;
ruffin
70

Você também pode usar a string indexOf sem criar nenhuma matriz.

O segundo parâmetro é o índice para começar a procurar a próxima correspondência.

function nthIndex(str, pat, n){
    var L= str.length, i= -1;
    while(n-- && i++<L){
        i= str.indexOf(pat, i);
        if (i < 0) break;
    }
    return i;
}

var s= "XYZ 123 ABC 456 ABC 789 ABC";

nthIndex(s,'ABC',3)

/*  returned value: (Number)
24
*/
kennebec
fonte
Eu gosto desta versão por causa do cache de comprimento e não estender o protótipo String.
Christophe Roussy
8
de acordo com jsperf, este método é muito mais rápido do que a resposta aceita
boop
O incremento de ipode ser menos confuso:var i; for (i = 0; n > 0 && i !== -1; n -= 1) { i = str.indexOf(pat, /* fromIndex */ i ? (i + 1) : i); } return i;
hlfcoding
1
Eu prefiro esta resposta à aceita, pois quando testei para uma segunda instância que não existia, a outra resposta retornou o comprimento da primeira string onde esta retornou -1. Um voto favorável e obrigado.
João
2
É um absurdo que este não seja um recurso embutido do JS.
Sinister Beard
20

Trabalhando com a resposta de Kennebec, criei uma função de protótipo que retornará -1 se a enésima ocorrência não for encontrada em vez de 0.

String.prototype.nthIndexOf = function(pattern, n) {
    var i = -1;

    while (n-- && i++ < this.length) {
        i = this.indexOf(pattern, i);
        if (i < 0) break;
    }

    return i;
}
ilovett
fonte
2
Nunca, jamais, use o camelCase, pois a eventual adaptação de recursos nativamente poderia ser substituída acidentalmente por este protótipo. Neste caso eu recomendo todas as letras minúsculas e sublinhado (traços de URLs): String.prototype.nth_index_of. Mesmo se você achar que seu nome é único e louco o suficiente, o mundo vai provar que ele pode e vai ficar ainda mais louco.
John
Especialmente ao fazer prototipagem. Claro, ninguém pode usar esse nome de método específico, embora, ao permitir-se fazer isso, você crie um mau hábito. A diferente embora exemplo crítica: sempre dados anexar ao fazer um SQL INSERTcomo mysqli_real_escape_stringse não proteger contra hacks aspas simples. Grande parte da programação profissional não consiste apenas em ter bons hábitos, mas também em compreender por que tais hábitos são importantes. :-)
John
1
Não estenda o protótipo da string.
4

Porque a recursão é sempre a resposta.

function getPosition(input, search, nth, curr, cnt) {
    curr = curr || 0;
    cnt = cnt || 0;
    var index = input.indexOf(search);
    if (curr === nth) {
        if (~index) {
            return cnt;
        }
        else {
            return -1;
        }
    }
    else {
        if (~index) {
            return getPosition(input.slice(index + search.length),
              search,
              nth,
              ++curr,
              cnt + index + search.length);
        }
        else {
            return -1;
        }
    }
}
Florian Margaine
fonte
1
@RenanCoelho O tilde ( ~) é o operador NOT bit a bit em JavaScript: developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/…
Sébastien
2

Esta é minha solução, que apenas itera sobre a string até que as ncorrespondências sejam encontradas:

String.prototype.nthIndexOf = function(searchElement, n, fromElement) {
    n = n || 0;
    fromElement = fromElement || 0;
    while (n > 0) {
        fromElement = this.indexOf(searchElement, fromElement);
        if (fromElement < 0) {
            return -1;
        }
        --n;
        ++fromElement;
    }
    return fromElement - 1;
};

var string = "XYZ 123 ABC 456 ABC 789 ABC";
console.log(string.nthIndexOf('ABC', 2));

>> 16
Alnitak
fonte
2

Este método cria uma função que chama o índice de enésimas ocorrências armazenadas em uma matriz

function nthIndexOf(search, n) { 
    var myArray = []; 
    for(var i = 0; i < myString.length; i++) { //loop thru string to check for occurrences
        if(myStr.slice(i, i + search.length) === search) { //if match found...
            myArray.push(i); //store index of each occurrence           
        }
    } 
    return myArray[n - 1]; //first occurrence stored in index 0 
}
Sharon Choe
fonte
Acho que você não definiu myString no código acima e não tem certeza se myStr === myString?
Seth Eden
1

Caminho mais curto e acho mais fácil, sem criar strings desnecessárias.

const findNthOccurence = (string, nth, char) => {
  let index = 0
  for (let i = 0; i < nth; i += 1) {
    if (index !== -1) index = string.indexOf(char, index + 1)
  }
  return index
}
Piotr
fonte
0

Usando indexOfe recursão :

Primeiro verifique se a enésima posição passada é maior do que o número total de ocorrências de substring. Se passado, percorre recursivamente cada índice até que o enésimo seja encontrado.

var getNthPosition = function(str, sub, n) {
    if (n > str.split(sub).length - 1) return -1;
    var recursePosition = function(n) {
        if (n === 0) return str.indexOf(sub);
        return str.indexOf(sub, recursePosition(n - 1) + 1);
    };
    return recursePosition(n);
};
Eric Amshukov
fonte
0

Usando [String.indexOf][1]

var stringToMatch = "XYZ 123 ABC 456 ABC 789 ABC";

function yetAnotherGetNthOccurance(string, seek, occurance) {
    var index = 0, i = 1;

    while (index !== -1) {
        index = string.indexOf(seek, index + 1);
        if (occurance === i) {
           break;
        }
        i++;
    }
    if (index !== -1) {
        console.log('Occurance found in ' + index + ' position');
    }
    else if (index === -1 && i !== occurance) {
        console.log('Occurance not found in ' + occurance + ' position');
    }
    else {
        console.log('Occurance not found');
    }
}

yetAnotherGetNthOccurance(stringToMatch, 'ABC', 2);

// Output: Occurance found in 16 position

yetAnotherGetNthOccurance(stringToMatch, 'ABC', 20);

// Output: Occurance not found in 20 position

yetAnotherGetNthOccurance(stringToMatch, 'ZAB', 1)

// Output: Occurance not found
sk8terboi87 ツ
fonte
0
function getStringReminder(str, substr, occ) {
   let index = str.indexOf(substr);
   let preindex = '';
   let i = 1;
   while (index !== -1) {
      preIndex = index;
      if (occ == i) {
        break;
      }
      index = str.indexOf(substr, index + 1)
      i++;
   }
   return preIndex;
}
console.log(getStringReminder('bcdefgbcdbcd', 'bcd', 3));
Arul Benito
fonte
-2

Eu estava brincando com o código a seguir para outra pergunta no StackOverflow e pensei que poderia ser apropriado para aqui. A função printList2 permite o uso de uma regex e lista todas as ocorrências em ordem. (printList foi uma tentativa de uma solução anterior, mas falhou em vários casos.)

<html>
<head>
<title>Checking regex</title>
<script>
var string1 = "123xxx5yyy1234ABCxxxabc";
var search1 = /\d+/;
var search2 = /\d/;
var search3 = /abc/;
function printList(search) {
   document.writeln("<p>Searching using regex: " + search + " (printList)</p>");
   var list = string1.match(search);
   if (list == null) {
      document.writeln("<p>No matches</p>");
      return;
   }
   // document.writeln("<p>" + list.toString() + "</p>");
   // document.writeln("<p>" + typeof(list1) + "</p>");
   // document.writeln("<p>" + Array.isArray(list1) + "</p>");
   // document.writeln("<p>" + list1 + "</p>");
   var count = list.length;
   document.writeln("<ul>");
   for (i = 0; i < count; i++) {
      document.writeln("<li>" +  "  " + list[i] + "   length=" + list[i].length + 
          " first position=" + string1.indexOf(list[i]) + "</li>");
   }
   document.writeln("</ul>");
}
function printList2(search) {
   document.writeln("<p>Searching using regex: " + search + " (printList2)</p>");
   var index = 0;
   var partial = string1;
   document.writeln("<ol>");
   for (j = 0; j < 100; j++) {
       var found = partial.match(search);
       if (found == null) {
          // document.writeln("<p>not found</p>");
          break;
       }
       var size = found[0].length;
       var loc = partial.search(search);
       var actloc = loc + index;
       document.writeln("<li>" + found[0] + "  length=" + size + "  first position=" + actloc);
       // document.writeln("  " + partial + "  " + loc);
       partial = partial.substring(loc + size);
       index = index + loc + size;
       document.writeln("</li>");
   }
   document.writeln("</ol>");

}
</script>
</head>
<body>
<p>Original string is <script>document.writeln(string1);</script></p>
<script>
   printList(/\d+/g);
   printList2(/\d+/);
   printList(/\d/g);
   printList2(/\d/);
   printList(/abc/g);
   printList2(/abc/);
   printList(/ABC/gi);
   printList2(/ABC/i);
</script>
</body>
</html>

Bradley Ross
fonte