Verifique se a string termina com uma das strings de uma lista

220

Qual é a maneira pitônica de escrever o seguinte código?

extensions = ['.mp3','.avi']
file_name = 'test.mp3'

for extension in extensions:
    if file_name.endswith(extension):
        #do stuff

Tenho uma vaga memória de que a declaração explícita do forloop pode ser evitada e escrita na ifcondição. Isso é verdade?

TheMeaningfulEngineer
fonte
2
Embora essa pergunta seja bem respondida, talvez o autor tenha pensado originalmente if any((file_name.endswith(ext) for ext in extensions)).
sapht

Respostas:

450

Embora não seja amplamente conhecido, o str.endswith também aceita uma tupla. Você não precisa fazer um loop.

>>> 'test.mp3'.endswith(('.mp3', '.avi'))
True
falsetru
fonte
10
você sabe por que ele não aceita uma lista, mas faz uma tupla? apenas curioso
ilyail3
2
@falsetru O link na resposta não responde explicitamente a essa pergunta. Ele menciona apenas que pode aceitar tuplas, mas não por que não pode aceitar listas. Como as duas são seqüências, a única diferença que posso ver é que as listas são mutáveis, enquanto as tuplas são imutáveis. Posso estar errado, mas não vejo outra razão para isso ser explicitamente declarado.
precisa saber é o seguinte
4
Se você quiser verificar se um extremidades da corda com uma carta:import string; str.endswith(tuple(string.ascii_lowercase))
Alex Willison
3
apenas uma nota, endswithaceita tupla somente para python 2.5 e superior #
Akash Singh
1
Nunca soube disso! Perfeito!
fool4jesus 30/04
46

Apenas use:

if file_name.endswith(tuple(extensions)):
Jon Clements
fonte
Simples e eficaz!
Ced
6

Pegue uma extensão do arquivo e veja se está no conjunto de extensões:

>>> import os
>>> extensions = set(['.mp3','.avi'])
>>> file_name = 'test.mp3'
>>> extension = os.path.splitext(file_name)[1]
>>> extension in extensions
True

Usar um conjunto porque a complexidade do tempo para pesquisas em conjuntos é O (1) ( docs ).

alecxe
fonte
8
Só para nota como você menciona eficiência, para tuplas bastante curto, o .endswith()com um tuple internado será mais rápido do que uma pesquisa set
Jon Clements
@JonClements Eu acho que você precisa de um SO comentário de ouro crachá especial para fazer notas impressionantes nas respostas e perguntas :)
alecxe
Não - eu só estou indo para o distintivo "Stalking alecxe";)
Jon Clements
2
Observe também que, na versão 2.7 e mais recente, você pode usar a sintaxe matemática de conjuntos, {'.mp3','.avi'}evita a conversão extra de tipos e pode ser mais legível, dependendo do seu plano de fundo ('Embora possa causar confusão com dicionários e não possa ser usado para criar vazio]. conjuntos).
Perkins
@JonClements algum dia eu me torne tão sábio como você :)
alecxe
3

Há duas maneiras: expressões regulares e métodos string (str).

Os métodos de string geralmente são mais rápidos (~ 2x).

import re, timeit
p = re.compile('.*(.mp3|.avi)$', re.IGNORECASE)
file_name = 'test.mp3'
print(bool(t.match(file_name))
%timeit bool(t.match(file_name)

792 ns ± 1,83 ns por loop (média ± desvio padrão de 7 corridas, 1000000 loops cada)

file_name = 'test.mp3'
extensions = ('.mp3','.avi')
print(file_name.lower().endswith(extensions))
%timeit file_name.lower().endswith(extensions)

274 ns ± 4,22 ns por loop (média ± desvio padrão de 7 corridas, 1000000 loops cada)

Igor A
fonte
1

Eu tenho isto:

def has_extension(filename, extension):

    ext = "." + extension
    if filename.endswith(ext):
        return True
    else:
        return False
Thomas Wouters
fonte
1
Você quer dizer return filename.endswith(ext)? : P
Mr_and_Mrs_D
1

Acabei de descobrir isso, enquanto procurava por outra coisa.

Eu recomendaria ir com os métodos no ospacote. Isso ocorre porque você pode torná-lo mais geral, compensando qualquer caso estranho.

Você pode fazer algo como:

import os

the_file = 'aaaa/bbbb/ccc.ddd'

extensions_list = ['ddd', 'eee', 'fff']

if os.path.splitext(the_file)[-1] in extensions_list:
    # Do your thing.
Xxxo
fonte
0

Outra possibilidade poderia ser usar a instrução IN:

extensions = ['.mp3','.avi']
file_name  = 'test.mp3'
if "." in file_name and file_name[file_name.rindex("."):] in extensions:
    print(True)
NeverHopeless
fonte
@ Rainald62, indexdeve estar rindexnesse caso.
NeverHopeless
0

Outra maneira que pode retornar a lista de strings correspondentes é

sample = "alexis has the control"
matched_strings = filter(sample.endswith, ["trol", "ol", "troll"])
print matched_strings
['trol', 'ol']
Akash Singh
fonte