Como preencher zeros em uma string?

1445

O que é uma maneira Pythonic de preencher uma string numérica com zeros à esquerda, ou seja, para que a string numérica tenha um comprimento específico?

Nicolas Gervais
fonte

Respostas:

2394

Cordas:

>>> n = '4'
>>> print(n.zfill(3))
004

E para números:

>>> n = 4
>>> print(f'{n:03}') # Preferred method, python >= 3.6
004
>>> print('%03d' % n)
004
>>> print(format(n, '03')) # python >= 2.6
004
>>> print('{0:03d}'.format(n))  # python >= 2.6 + python 3
004
>>> print('{foo:03d}'.format(foo=n))  # python >= 2.6 + python 3
004
>>> print('{:03d}'.format(n))  # python >= 2.7 + python3
004

Documentação de formatação de string .

Harley Holcombe
fonte
3
Código de formato desconhecido 'd' para o objeto do tipo 'float'.
precisa
7
Os comentários python >= 2.6estão incorretos. Essa sintaxe não funciona python >= 3. Você pode alterá-lo para python < 3, mas posso sugerir sempre usar parênteses e omitir completamente os comentários (incentivando o uso recomendado)?
Jason R. Coombs
4
Observe que você não precisa numerar suas seqüências de formato: '{:03d} {:03d}'.format(1, 2)atribui implicitamente os valores em ordem.
Dragon
1
@ JasonR.Coombs: Suponho que você quis dizer a printdeclaração, quando deveria ser uma printfunção no Python 3? Editei nas parênteses; Como apenas uma coisa está sendo impressa, ela funciona de forma idêntica agora no Py2 e Py3.
ShadowRanger
353

Basta usar o método rjust do objeto string.

Este exemplo criará uma sequência de 10 caracteres, preenchendo conforme necessário.

>>> t = 'test'
>>> t.rjust(10, '0')
>>> '000000test'
Paul D. Eden
fonte
123

Além disso zfill, você pode usar a formatação geral de strings:

print(f'{number:05d}') # (since Python 3.6), or
print('{:05d}'.format(number)) # or
print('{0:05d}'.format(number)) # or (explicit 0th positional arg. selection)
print('{n:05d}'.format(n=number)) # or (explicit `n` keyword arg. selection)
print(format(number, '05d'))

Documentação para formatação de strings e f-strings .

Konrad Rudolph
fonte
3
O PEP 3101 não declara que% foi preterido de forma alguma.
Zwirbeltier
@zwirbeltier PEP 3101 explica como usar o formato, foi o que eu quis dizer.
Konrad Rudolph
4
O "EDIT" ainda indica "... este método de formatação está obsoleto ...".
Zwirbeltier
1
@zwirbeltier Sim, e está obsoleto. Mas isso não é afirmado diretamente no PEP. A documentação, no entanto, diz usar format, e as pessoas geralmente interpretam isso como intenção de desaprovação.
Konrad Rudolph
1
@ LarsH Obrigado por encontrar isso. Portanto, eles estão severamente atrasados ​​(o Python 3.1 não está no futuro, está em um passado distante). Dado isso, ainda não acho que a resposta seja enganosa, apenas não é rigorosamente atualizada toda vez que o cronograma de desenvolvimento do Python muda em uma nova direção arbitrária. De qualquer forma, isso me deu a oportunidade de remover algumas coisas irrelevantes e desatualizadas da minha resposta.
Konrad Rudolph
63

Para Python 3.6+ usando f-strings:

>>> i = 1
>>> f"{i:0>2}"  # Works for both numbers and strings.
'01'
>>> f"{i:02}"  # Works only for numbers.
'01'

Para Python 2 e Python 3.5:

>>> "{:0>2}".format("1")  # Works for both numbers and strings.
'01'
>>> "{:02}".format(1)  # Works only for numbers.
'01'
Cees Timmerman
fonte
56
>>> '99'.zfill(5)
'00099'
>>> '99'.rjust(5,'0')
'00099'

se você quiser o contrário:

>>> '99'.ljust(5,'0')
'99000'
Victor Barrantes
fonte
39

str(n).zfill(width)funcionará com strings, ints, floats ... e é compatível com Python 2. x e 3. x :

>>> n = 3
>>> str(n).zfill(5)
'00003'
>>> n = '3'
>>> str(n).zfill(5)
'00003'
>>> n = '3.0'
>>> str(n).zfill(5)
'003.0'
Johnsyweb
fonte
23

Para aqueles que vieram aqui para entender e não apenas uma resposta rápida. Eu faço isso especialmente para seqüências de tempo:

hour = 4
minute = 3
"{:0>2}:{:0>2}".format(hour,minute)
# prints 04:03

"{:0>3}:{:0>5}".format(hour,minute)
# prints '004:00003'

"{:0<3}:{:0<5}".format(hour,minute)
# prints '400:30000'

"{:$<3}:{:#<5}".format(hour,minute)
# prints '4$$:3####'

Símbolos "0" que substituir pelos caracteres de preenchimento "2", o padrão é um espaço vazio

Os símbolos ">" alinham todos os caracteres 2 "0" à esquerda da string

":" simboliza o formato_espec.

elad prata
fonte
23

Qual é a maneira mais pitônica de preencher uma sequência numérica com zeros à esquerda, ou seja, para que a sequência numérica tenha um comprimento específico?

str.zfill destina-se especificamente a fazer isso:

>>> '1'.zfill(4)
'0001'

Observe que ele se destina especificamente a manipular cadeias numéricas conforme solicitado e move a +ou -para o início da cadeia:

>>> '+1'.zfill(4)
'+001'
>>> '-1'.zfill(4)
'-001'

Aqui está a ajuda sobre str.zfill:

>>> help(str.zfill)
Help on method_descriptor:

zfill(...)
    S.zfill(width) -> str

    Pad a numeric string S with zeros on the left, to fill a field
    of the specified width. The string S is never truncated.

atuação

Este também é o método mais eficiente de métodos alternativos:

>>> min(timeit.repeat(lambda: '1'.zfill(4)))
0.18824880896136165
>>> min(timeit.repeat(lambda: '1'.rjust(4, '0')))
0.2104538488201797
>>> min(timeit.repeat(lambda: f'{1:04}'))
0.32585487607866526
>>> min(timeit.repeat(lambda: '{:04}'.format(1)))
0.34988890308886766

Para comparar melhor maçãs com maçãs pelo %método (observe que na verdade é mais lento), que de outra forma pré-calculará:

>>> min(timeit.repeat(lambda: '1'.zfill(0 or 4)))
0.19728074967861176
>>> min(timeit.repeat(lambda: '%04d' % (0 or 1)))
0.2347015216946602

Implementação

Com um pouco de pesquisa, encontrei a implementação do zfillmétodo em Objects/stringlib/transmogrify.h:

static PyObject *
stringlib_zfill(PyObject *self, PyObject *args)
{
    Py_ssize_t fill;
    PyObject *s;
    char *p;
    Py_ssize_t width;

    if (!PyArg_ParseTuple(args, "n:zfill", &width))
        return NULL;

    if (STRINGLIB_LEN(self) >= width) {
        return return_self(self);
    }

    fill = width - STRINGLIB_LEN(self);

    s = pad(self, fill, 0, '0');

    if (s == NULL)
        return NULL;

    p = STRINGLIB_STR(s);
    if (p[fill] == '+' || p[fill] == '-') {
        /* move sign to beginning of string */
        p[0] = p[fill];
        p[fill] = '0';
    }

    return s;
}

Vamos percorrer esse código C.

Primeiro, ele analisa o argumento em posição, o que significa que não permite argumentos de palavras-chave:

>>> '1'.zfill(width=4)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: zfill() takes no keyword arguments

Em seguida, verifica se tem o mesmo comprimento ou mais e, nesse caso, retorna a string.

>>> '1'.zfill(0)
'1'

zfillchamadas pad(esta padfunção também é chamada por ljust, rjuste centertambém). Basicamente, isso copia o conteúdo para uma nova string e preenche o preenchimento.

static inline PyObject *
pad(PyObject *self, Py_ssize_t left, Py_ssize_t right, char fill)
{
    PyObject *u;

    if (left < 0)
        left = 0;
    if (right < 0)
        right = 0;

    if (left == 0 && right == 0) {
        return return_self(self);
    }

    u = STRINGLIB_NEW(NULL, left + STRINGLIB_LEN(self) + right);
    if (u) {
        if (left)
            memset(STRINGLIB_STR(u), fill, left);
        memcpy(STRINGLIB_STR(u) + left,
               STRINGLIB_STR(self),
               STRINGLIB_LEN(self));
        if (right)
            memset(STRINGLIB_STR(u) + left + STRINGLIB_LEN(self),
                   fill, right);
    }

    return u;
}

Após a chamada pad, zfillmove todos os anteriores +ou anteriores -ao início da sequência.

Observe que, para que a string original seja realmente numérica, não é necessário:

>>> '+foo'.zfill(10)
'+000000foo'
>>> '-foo'.zfill(10)
'-000000foo'
Aaron Hall
fonte
para o desempenho, há casos em que as strings f são melhores, incluindo casos de uso para python2 vs python3? Além disso, acho que zfill não é comum ele iria ajudar a sua resposta para ter um link para os docs
prata elad
O @eladsilver depende da sua intenção, tendo em mente o comportamento com +e -, e eu adicionei um link para a documentação!
Aaron Hall
17
width = 10
x = 5
print "%0*d" % (width, x)
> 0000000005

Consulte a documentação impressa para obter todos os detalhes interessantes!

Atualização para o Python 3.x (7,5 anos depois)

Essa última linha agora deve ser:

print("%0*d" % (width, x))

Ou print()seja, agora é uma função, não uma declaração. Note que eu ainda prefiro o printf()estilo Old School porque, IMNSHO, parece melhor, e porque, eu uso essa notação desde janeiro de 1980. Algo ... cachorros velhos .. algo algo ... novos truques.

Peter Rowell
fonte
desde 1980 ... então você é um programador de 60 anos de idade ... poderia dar mais explicações sobre como "%0*d" % (width, x)é interpretado por python?
21419 Lee
15

Ao usar Python >= 3.6, a maneira mais limpa é usar f-strings com formatação de string :

>>> s = f"{1:08}"  # inline with int
>>> s
'00000001'
>>> s = f"{'1':0>8}"  # inline with str
>>> s
'00000001'
>>> n = 1
>>> s = f"{n:08}"  # int variable
>>> s
'00000001'
>>> c = "1"
>>> s = f"{c:0>8}"  # str variable
>>> s
'00000001'

Eu preferiria formatar com um int, pois só então o sinal será tratado corretamente:

>>> f"{-1:08}"
'-0000001'

>>> f"{1:+08}"
'+0000001'

>>> f"{'-1':0>8}"
'000000-1'
ruohola
fonte
Obrigado pelo novo exemplo de sintaxe. o caractere de preenchimento 'x' será: v = "A18"; s = f '{v: x> 8}' + "|"; ou s = v. just (8, "x") + "|";
Charlie
@Charlie that Isso foi uma pergunta para mim ou apenas uma declaração?
ruohola 21/02
apenas uma afirmação. testou um pouco mais de uso.
Charlie
4

Para CEPs salvos como números inteiros:

>>> a = 6340
>>> b = 90210
>>> print '%05d' % a
06340
>>> print '%05d' % b
90210
Acumenus
fonte
1
Você está correto, e eu como sua sugestão com zfill melhor de qualquer maneira
3

Comparação rápida de tempo:

setup = '''
from random import randint
def test_1():
    num = randint(0,1000000)
    return str(num).zfill(7)
def test_2():
    num = randint(0,1000000)
    return format(num, '07')
def test_3():
    num = randint(0,1000000)
    return '{0:07d}'.format(num)
def test_4():
    num = randint(0,1000000)
    return format(num, '07d')
def test_5():
    num = randint(0,1000000)
    return '{:07d}'.format(num)
def test_6():
    num = randint(0,1000000)
    return '{x:07d}'.format(x=num)
def test_7():
    num = randint(0,1000000)
    return str(num).rjust(7, '0')
'''
import timeit
print timeit.Timer("test_1()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_2()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_3()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_4()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_5()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_6()", setup=setup).repeat(3, 900000)
print timeit.Timer("test_7()", setup=setup).repeat(3, 900000)


> [2.281613943830961, 2.2719342631547077, 2.261691106209631]
> [2.311480238815406, 2.318420542148333, 2.3552384305184493]
> [2.3824197456864304, 2.3457239951596485, 2.3353268829498646]
> [2.312442972404032, 2.318053102249902, 2.3054072168069872]
> [2.3482314132374853, 2.3403386400002475, 2.330108825844775]
> [2.424549090688892, 2.4346475296851438, 2.429691196530058]
> [2.3259756401716487, 2.333549212826732, 2.32049893822186]

Eu fiz testes diferentes de diferentes repetições. As diferenças não são enormes, mas em todos os testes, a zfillsolução foi mais rápida.

Simon Steinberger
fonte
1

Outra abordagem seria usar uma compreensão de lista com uma verificação de condição para comprimentos. Abaixo está uma demonstração:

# input list of strings that we want to prepend zeros
In [71]: list_of_str = ["101010", "10101010", "11110", "0000"]

# prepend zeros to make each string to length 8, if length of string is less than 8
In [83]: ["0"*(8-len(s)) + s if len(s) < desired_len else s for s in list_of_str]
Out[83]: ['00101010', '10101010', '00011110', '00000000']
kmario23
fonte
0

Está tudo bem também:

 h = 2
 m = 7
 s = 3
 print("%02d:%02d:%02d" % (h, m, s))

então a saída será: "02:07:03"

zzfima
fonte
-2

Você também pode repetir "0", anexá-lo str(n)e obter a fatia de largura mais à direita. Expressão rápida e suja.

def pad_left(n, width, pad="0"):
    return ((pad * width) + str(n))[-width:]
J Lacar
fonte
1
Isso só funciona para números positivos. Fica um pouco mais complicado se você quiser negativos também. Mas essa expressão é boa para trabalhos rápidos e sujos, se você não se importa com esse tipo de coisa.
precisa
Não tenho absolutamente nenhuma idéia de por que isso foi prejudicado. Se é porque ele não funciona em números negativos de forma justa o suficiente, mas a principal razão pela qual alguém deixaria o teclado com zeros é para números de identificação. Se você tiver números de identificação negativos, acho que tem problemas maiores ... espera que o seu bloco tenha o formato '00000-1234'? ou '-000001234'? Honestamente, dada a pergunta em que essa resposta funciona, é simples, é limpo, é extensível. Pode não ser o zfill, mas se responder à pergunta, deverá ser votado.
TastySlowCooker 23/09/19