Como posso dividir uma string em segmentos de n caracteres?

201

Como o título diz, eu tenho uma string e quero dividir em segmentos de n caracteres.

Por exemplo:

var str = 'abcdefghijkl';

depois de um pouco de magia n=3, ele se tornará

var arr = ['abc','def','ghi','jkl'];

Existe uma maneira de fazer isso?

Ben
fonte

Respostas:

359

var str = 'abcdefghijkl';
console.log(str.match(/.{1,3}/g));

Nota: Use em {1,3}vez de {3}incluir apenas o restante para comprimentos de sequência que não sejam múltiplos de 3, por exemplo:

console.log("abcd".match(/.{1,3}/g)); // ["abc", "d"]


Mais algumas sutilezas:

  1. Se a sua string puder conter novas linhas ( que você deseja contar como caractere, em vez de dividi-la ), .ela não as capturará. Use em /[\s\S]{1,3}/vez disso. (Obrigado, Mike).
  2. Se sua string estiver vazia, match()retornará nullquando você estiver esperando uma matriz vazia. Proteja-se disso anexando || [].

Então você pode acabar com:

var str = 'abcdef \t\r\nghijkl';
var parts = str.match(/[\s\S]{1,3}/g) || [];
console.log(parts);

console.log(''.match(/[\s\S]{1,3}/g) || []);

David Tang
fonte
Tecnicamente, essa é a melhor resposta, pois captura todo o texto de uma sequência que não é divisível por 3 (ele captura os últimos 2 ou 1 caracteres).
Erik
6
Use em [\s\S]vez de .para não falhar em novas linhas.
Mike Samuel
2
Você pode querer iniciar um novo ciclo em cada linha. Se você realmente possui novas linhas, elas provavelmente indicam algum tipo de transição. str.match (/. {1,3} / gm) pode ser uma escolha melhor.
7118 kennebec
+1 Cuidado: ''.match(/.{1,3}/g) e ''.match(/.{3}/g)retorne em nullvez de uma matriz vazia.
Web_Designer
4
É possível ter uma variável no lugar do número 3?
Ana Claudia
46

Se você não quis usar uma expressão regular ...

var chunks = [];

for (var i = 0, charsLength = str.length; i < charsLength; i += 3) {
    chunks.push(str.substring(i, i + 3));
}

jsFiddle .

... caso contrário, a solução regex é muito boa :)

alex
fonte
1
+1 porque eu prefiro isso se 3for variável conforme sugerido pelo OP. É mais legível do que concatenar uma string regexp.
David Tang
se somente você poderia envolver isso em uma função útil pronto para ser usado
mmm
1
Isso é mais do que 10x mais rápido que a opção regex, então eu usaria isso (dentro de uma função) jsbench.github.io/#9cb819bf1ce429575f8535a211f72d5a
Job
1
Minha declaração anterior se aplica ao Chromium (também, eu estava muito atrasado com a edição do comentário anterior, daí o novo). No Firefox, atualmente é "apenas" 30% mais rápido na minha máquina, mas ainda é sempre melhor.
Job
isso é sustentável em grandes extensões de barbante?
Jacob Schneider
22
str.match(/.{3}/g); // => ['abc', 'def', 'ghi', 'jkl']
maerics
fonte
Isso funciona para 3mim, mas retorna nullcom 250. 🤔
Jim
9

Com base nas respostas anteriores a esta pergunta; a seguinte função dividirá uma string ( str) n-number ( size) de caracteres.

function chunk(str, size) {
    return str.match(new RegExp('.{1,' + size + '}', 'g'));
}

Demo

(function() {
  function chunk(str, size) {
    return str.match(new RegExp('.{1,' + size + '}', 'g'));
  }
  
  var str = 'HELLO WORLD';
  println('Simple binary representation:');
  println(chunk(textToBin(str), 8).join('\n'));
  println('\nNow for something crazy:');
  println(chunk(textToHex(str, 4), 8).map(function(h) { return '0x' + h }).join('  '));
  
  // Utiliy functions, you can ignore these.
  function textToBin(text) { return textToBase(text, 2, 8); }
  function textToHex(t, w) { return pad(textToBase(t,16,2), roundUp(t.length, w)*2, '00'); }
  function pad(val, len, chr) { return (repeat(chr, len) + val).slice(-len); }
  function print(text) { document.getElementById('out').innerHTML += (text || ''); }
  function println(text) { print((text || '') + '\n'); }
  function repeat(chr, n) { return new Array(n + 1).join(chr); }
  function textToBase(text, radix, n) {
    return text.split('').reduce(function(result, chr) {
      return result + pad(chr.charCodeAt(0).toString(radix), n, '0');
    }, '');
  }
  function roundUp(numToRound, multiple) { 
    if (multiple === 0) return numToRound;
    var remainder = numToRound % multiple;
    return remainder === 0 ? numToRound : numToRound + multiple - remainder;
  }
}());
#out {
  white-space: pre;
  font-size: 0.8em;
}
<div id="out"></div>

Mr. Polywhirl
fonte
2

Minha solução (sintaxe ES6):

const source = "8d7f66a9273fc766cd66d1d";
const target = [];
for (
    const array = Array.from(source);
    array.length;
    target.push(array.splice(0,2).join(''), 2));

Poderíamos até criar uma função com isso:

function splitStringBySegmentLength(source, segmentLength) {
    if (!segmentLength || segmentLength < 1) throw Error('Segment length must be defined and greater than/equal to 1');
    const target = [];
    for (
        const array = Array.from(source);
        array.length;
        target.push(array.splice(0,segmentLength).join('')));
    return target;
}

Em seguida, você pode chamar a função facilmente de maneira reutilizável:

const source = "8d7f66a9273fc766cd66d1d";
const target = splitStringBySegmentLength(source, 2);

Felicidades

Jesus Gonzalez
fonte
2
const chunkStr = (str, n, acc) => {     
    if (str.length === 0) {
        return acc
    } else {
        acc.push(str.substring(0, n));
        return chunkStr(str.substring(n), n, acc);
    }
}
const str = 'abcdefghijkl';
const splittedString = chunkStr(str, 3, []);

Solução limpa sem REGEX

grave
fonte
1
function chunk(er){
return er.match(/.{1,75}/g).join('\n');
}

A função acima é o que eu uso para chunking Base64. Ele criará uma quebra de linha com 75 caracteres.

Dave Brown
fonte
Também poderia fazer replace(/.{1,75}/g, '$&\n').
alex
1

Aqui, intercalamos uma string com outra string a cada n caracteres:

export const intersperseString = (n: number, intersperseWith: string, str: string): string => {

  let ret = str.slice(0,n), remaining = str;

  while (remaining) {
    let v = remaining.slice(0, n);
    remaining = remaining.slice(v.length);
    ret += intersperseWith + v;
  }

  return ret;

};

se usarmos o acima descrito assim:

console.log(splitString(3,'|', 'aagaegeage'));

Nós temos:

aag | aag | aeg | eag | e

e aqui fazemos o mesmo, mas pressionamos para uma matriz:

export const sperseString = (n: number, str: string): Array<string> => {

  let ret = [], remaining = str;

  while (remaining) {
    let v = remaining.slice(0, n);
    remaining = remaining.slice(v.length);
    ret.push(v);
  }

  return ret;

};

e execute-o:

console.log(sperseString(5, 'foobarbaztruck'));

Nós temos:

['fooba', 'rbazt', 'ruck']

se alguém souber uma maneira de simplificar o código acima, lmk, mas deve funcionar bem para strings.

Alexander Mills
fonte
seu primeiro snippet não estava funcionando conforme o esperado. Eu modifiquei aqui: jsfiddle.net/omarojo/ksvx2txb/261
omarojo
0

Alguma solução limpa sem usar expressões regulares:

/**
* Create array with maximum chunk length = maxPartSize
* It work safe also for shorter strings than part size
**/
function convertStringToArray(str, maxPartSize){

  const chunkArr = [];
  let leftStr = str;
  do {

    chunkArr.push(leftStr.substring(0, maxPartSize));
    leftStr = leftStr.substring(maxPartSize, leftStr.length);

  } while (leftStr.length > 0);

  return chunkArr;
};

Exemplo de uso - https://jsfiddle.net/maciejsikora/b6xppj4q/ .

Eu também tentei comparar minha solução para regexp uma que foi escolhida como resposta certa. Alguns testes podem ser encontrados no jsfiddle - https://jsfiddle.net/maciejsikora/2envahrk/ . Os testes estão mostrando que os dois métodos têm desempenho semelhante; talvez, à primeira vista, a solução regexp seja um pouco mais rápida, mas julgue você mesmo.

Maciej Sikora
fonte
0

Com .split:

var arr = str.split( /(?<=^(?:.{3})+)(?!$)/ )  // [ 'abc', 'def', 'ghi', 'jkl' ]

e .replaceserá:

var replaced = str.replace( /(?<=^(.{3})+)(?!$)/g, ' || ' )  // 'abc || def || ghi || jkl'



/(?!$)/é parar antes do final /$/, sem é:

var arr      = str.split( /(?<=^(?:.{3})+)/ )        // [ 'abc', 'def', 'ghi', 'jkl' ]     // I don't know why is not [ 'abc', 'def', 'ghi', 'jkl' , '' ], comment?
var replaced = str.replace( /(?<=^(.{3})+)/g, ' || ')  // 'abc || def || ghi || jkl || '

ignorando o grupo /(?:... )/não é necessário, .replacemas .splitestá adicionando grupos ao arr:

var arr = str.split( /(?<=^(.{3})+)(?!$)/ )  // [ 'abc', 'abc', 'def', 'abc', 'ghi', 'abc', 'jkl' ]
Денис Дечев
fonte
0

Aqui está uma maneira de fazê-lo sem expressões regulares ou loops explícitos, embora esteja ampliando um pouco a definição de um liner:

const input = 'abcdefghijlkm';

// Change `3` to the desired split length.
const output = input.split('').reduce((s, c) => {let l = s.length-1; (s[l] && s[l].length < 3) ? s[l] += c : s.push(c); return s;}, []);

console.log(output);  // output: [ 'abc', 'def', 'ghi', 'jlk', 'm' ]

Ele funciona dividindo a cadeia de caracteres em uma matriz de caracteres individuais e, em seguida, usando Array.reducepara iterar sobre cada caractere. Normalmente reduce, retornaria um valor único, mas, nesse caso, o valor único passa a ser uma matriz, e conforme passamos sobre cada caractere, o anexamos ao último item dessa matriz. Quando o último item da matriz atingir o comprimento desejado, anexamos um novo item.

Malvineous
fonte
0

Chegando um pouco mais tarde à discussão, mas aqui uma variação é um pouco mais rápida que a substring + array.

// substring + array push + end precalc
var chunks = [];

for (var i = 0, e = 3, charsLength = str.length; i < charsLength; i += 3, e += 3) {
    chunks.push(str.substring(i, e));
}

Pré-calcular o valor final como parte do loop for é mais rápido do que fazer a matemática embutida na substring. Eu testei no Firefox e no Chrome e ambos mostram aceleração.

Você pode tentar aqui

Dragonaire
fonte