Como construir um objeto timedelta a partir de uma string simples

96

Estou escrevendo uma função que precisa de uma entrada timedelta para ser passada como uma string. O usuário deve inserir algo como "32m" ou "2h32m", ou mesmo "4:13" ou "5hr34m56s" ... Existe alguma biblioteca ou algo que já tenha esse tipo de coisa implementado?

sacerdote
fonte
Para as pessoas olhando apenas para construir um objeto timedelta de ddias, hhoras, mminutos e ssegundos usando uma linha (após a importação datetime): datetime.timedelta(days = d, hours = h, minutes=m, seconds=s).
zthomas.nc

Respostas:

72

Para o primeiro formato (5hr34m56s), você deve analisar usando expressões regulares

Aqui está a solução baseada em reformulação:

import re
from datetime import timedelta


regex = re.compile(r'((?P<hours>\d+?)hr)?((?P<minutes>\d+?)m)?((?P<seconds>\d+?)s)?')


def parse_time(time_str):
    parts = regex.match(time_str)
    if not parts:
        return
    parts = parts.groupdict()
    time_params = {}
    for (name, param) in parts.iteritems():
        if param:
            time_params[name] = int(param)
    return timedelta(**time_params)


>>> from parse_time import parse_time
>>> parse_time('12hr')
datetime.timedelta(0, 43200)
>>> parse_time('12hr5m10s')
datetime.timedelta(0, 43510)
>>> parse_time('12hr10s')
datetime.timedelta(0, 43210)
>>> parse_time('10s')
datetime.timedelta(0, 10)
>>> 
virhilo
fonte
4
Eu estava pensando em algum tipo de função que agüentaria qualquer coisa que você jogasse e ainda pudesse lidar com a conversão para timedelta.
priestc de
2
Eu adicionei um exemplo de solução baseada em re :)
virhilo
4
Não vejo como dateutil.parser.parse pode analisar durações, parece que sempre retorna uma data e hora. o que estou perdendo?
Nickolay
7
dateutil.parser.parsenão analisa timedeltaobjetos. Ele retorna um datetimee acionaria uma exceção para strings como '28:32:11.10'.
Spak de
95

Para mim, a solução mais elegante, sem ter que recorrer a bibliotecas externas como dateutil ou analisar manualmente a entrada, é usar ostrptime método de análise de string poderoso do datetime .

from datetime import datetime, timedelta
# we specify the input and the format...
t = datetime.strptime("05:20:25","%H:%M:%S")
# ...and use datetime's hour, min and sec properties to build a timedelta
delta = timedelta(hours=t.hour, minutes=t.minute, seconds=t.second)

Depois disso, você pode usar seu objeto timedelta normalmente, convertê-lo em segundos para ter certeza de que fizemos a coisa certa etc.

print(delta)
assert(5*60*60+20*60+25 == delta.total_seconds())
metakermit
fonte
33
Observe que essa abordagem só funciona se o intervalo de tempo for inferior a 24 horas ( datetime.strptime("32:20:25","%H:%M:%S")não funciona) e você precisa saber o formato de entrada exato.
verdesmarald,
Esta parte também responde à pergunta do OP. Se a função precisa lidar com vários formatos - você ainda precisa de inspeção de formato adicional (1 dois pontos ou 2?).
Danny Staple
3
@verdesmarald Então, a partir do python 3.5, existe uma solução elegante sem usar bibliotecas externas e sem assumir que o tempo é inferior a 24 horas?
máximo de
1
Acho a necessidade de especificar manualmente os parâmetros nomeados para o timedeltaparâmetro muito chato, mas o melhor que posso inventar para evitar isso é:, o delta = t - datetime.combine(t.date(), time.min)que é ... horrível.
Kyle Strand
2
Um problema sério com essa abordagem é que, se você incluir dias, enviar% d para o strptime não permitirá que você insira o dia 0, pois apenas dias> = 1 são válidos para uma data.
user1581390
75

Eu tive um pouco de tempo em minhas mãos ontem, então desenvolvi a resposta de @virhilo em um módulo Python, adicionando mais alguns formatos de expressão de tempo, incluindo todos aqueles solicitados por @priestc .

O código-fonte está no github (Licença MIT) para quem quiser. Também está no PyPI:

pip install pytimeparse

Retorna o tempo como um número de segundos:

>>> from pytimeparse.timeparse import timeparse
>>> timeparse('32m')
1920
>>> timeparse('2h32m')
9120
>>> timeparse('4:13')
253
>>> timeparse('5hr34m56s')
20096
>>> timeparse('1.2 minutes')
72
Wildwilhelm
fonte
existe um equivalente Java / Scala?
luca.giovagnoli
Impressionante! Muito obrigado
Bouncner
@ luca.giovagnoli Em Scala você pode usar a classe Duração. A duração pode ser construída a partir de strings como '15 segundos ',' 4 minutos 'etc.
Konrad Malik
14

Eu queria inserir apenas um tempo e depois adicioná-lo a várias datas, então funcionou para mim:

from datetime import datetime as dtt

time_only = dtt.strptime('15:30', "%H:%M") - dtt.strptime("00:00", "%H:%M")
kztd
fonte
dtt.strptime(myduration, "%H:%M:%S") - dtt(1900, 1, 1)também funciona ...
576i
8

Eu modifiquei a boa resposta de Virhilo com algumas atualizações:

  • adicionou uma afirmação de que a string é uma string de tempo válida
  • substitua o indicador de hora "hr" por "h"
  • permitir um indicador "d" - dias
  • permitir tempos não inteiros (por exemplo, 3m0.25s3 minutos, 0,25 segundos)

.

import re
from datetime import timedelta


regex = re.compile(r'^((?P<days>[\.\d]+?)d)?((?P<hours>[\.\d]+?)h)?((?P<minutes>[\.\d]+?)m)?((?P<seconds>[\.\d]+?)s)?$')


def parse_time(time_str):
    """
    Parse a time string e.g. (2h13m) into a timedelta object.

    Modified from virhilo's answer at https://stackoverflow.com/a/4628148/851699

    :param time_str: A string identifying a duration.  (eg. 2h13m)
    :return datetime.timedelta: A datetime.timedelta object
    """
    parts = regex.match(time_str)
    assert parts is not None, "Could not parse any time information from '{}'.  Examples of valid strings: '8h', '2d8h5m20s', '2m4s'".format(time_str)
    time_params = {name: float(param) for name, param in parts.groupdict().items() if param}
    return timedelta(**time_params)
Peter
fonte
1
Ótimo! Eu adicionei "*" entre os elementos para permitir também "1d 3h 5m"
Marcel Waldvogel
@MarcelWaldvogel legal, se você copiar o texto da nova regex adicionarei sua resposta em
Peter
@virhilo e Peter: Minha pequena evolução em seu código está aqui: github.com/zeitgitter/zeitgitterd/blob/master/zeitgitter/… . Presumo que não haja problema em usar seu código. Você tem alguma preferência para a licença? MIT, Apache, GPL,…?
Marcel Waldvogel
1
Marcel, você pode me enviar seu endereço para que eu possa processar? JK, vá em frente, qualquer licença está bem.
Peter
Aqui está o novo Regex; a diferença é o "*" s: regex = re.compile (r '^ ((? P <days> [\. \ d] +?) d)? *' r '((? P <hours> [\ . \ d] +?) h)? * 'r' ((? P <minutos> [\. \ d] +?) m)? * 'r' ((? P <segundos> [\. \ d] +?) s)? $ ')
Marcel Waldvogel
3

Se você usa Python 3, aqui está a versão atualizada da solução de Hari Shankar, que usei:

from datetime import timedelta
import re

regex = re.compile(r'(?P<hours>\d+?)/'
                   r'(?P<minutes>\d+?)/'
                   r'(?P<seconds>\d+?)$')

def parse_time(time_str):
    parts = regex.match(time_str)
    if not parts:
        return
    parts = parts.groupdict()
    print(parts)
    time_params = {}
    for name, param in parts.items():
        if param:
            time_params[name] = int(param)
    return timedelta(**time_params)
Alexey Kislitsin
fonte
3

Django vem com a função de utilitário parse_duration(). Da documentação :

Analisa uma string e retorna um datetime.timedelta.

Espera dados no formato "DD HH:MM:SS.uuuuuu"ou conforme especificado pela ISO 8601 (por exemplo, P4DT1H15M20Sque é equivalente a 4 1:15:20) ou formato de intervalo de dia e hora do PostgreSQL (por exemplo 3 days 04:05:06).

Don Kirkby
fonte