Dicionários e valores padrão

213

Supondo que connectionDetailsseja um dicionário Python, qual é a melhor, mais elegante e mais "pitônica" maneira de refatorar códigos como esse?

if "host" in connectionDetails:
    host = connectionDetails["host"]
else:
    host = someDefaultValue
mnowotka
fonte

Respostas:

311

Como isso:

host = connectionDetails.get('host', someDefaultValue)
MattH
fonte
40
Observe que o segundo argumento é um valor, não uma chave.
Marcin
7
+1 para facilitar a leitura, mas if/elseé muito mais rápido. Isso pode ou não desempenhar um papel.
Tim Tim #
7
@ Tim, você pode fornecer uma referência do porquê if/elseé mais rápido?
Nishantjr 27/10/2014
2
@ Tim: Eu supus que uma das vantagens de usar uma linguagem de nível superior é que o intérprete seria capaz de 'ver' dentro das funções e otimizá-lo - que o usuário não precisaria lidar tanto com micro-otimizações . Não é para isso que servem a compilação JIT?
Nishantjr 27/10/2014
3
@nishantjr: Python (pelo menos CPython, a variante mais comum) não possui compilação JIT. O PyPy pode realmente resolver isso mais rapidamente, mas eu não o instalei desde que o Python padrão sempre foi rápido o suficiente para meus propósitos até agora. Em geral, é improvável que importa na vida real - se você precisa fazer o número de tempo crítico trituração, Python provavelmente não é a língua de escolha ...
Tim Pietzcker
99

Você também pode usar o seguinte defaultdict:

from collections import defaultdict
a = defaultdict(lambda: "default", key="some_value")
a["blabla"] => "default"
a["key"] => "some_value"

Você pode passar qualquer função comum em vez de lambda:

from collections import defaultdict
def a():
  return 4

b = defaultdict(a, key="some_value")
b['absent'] => 4
b['key'] => "some_value"
tamerlaha
fonte
7
Eu vim aqui para algum problema diferente da pergunta do OP, e sua solução resolve exatamente isso.
0xc0de
Eu o marcaria com +1, mas infelizmente não se encaixa em getmétodos semelhantes.
0xc0de
Esta resposta foi útil para garantir que acréscimos a um dicionário incluíssem chaves padrão. Minha implementação é um pouco longa para ser descrita em uma resposta do StackOverflow, então escrevi sobre isso aqui. persagen.com/2020/03/05/…
Victoria Stuart
24

Embora .get()seja um bom idioma, é mais lento que if/else(e mais lento que try/exceptse a presença da chave no dicionário puder ser esperada na maioria das vezes):

>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}", 
... stmt="try:\n a=d[1]\nexcept KeyError:\n a=10")
0.07691968797894333
>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}", 
... stmt="try:\n a=d[2]\nexcept KeyError:\n a=10")
0.4583777282275605
>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}", 
... stmt="a=d.get(1, 10)")
0.17784020746671558
>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}", 
... stmt="a=d.get(2, 10)")
0.17952161730158878
>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}", 
... stmt="if 1 in d:\n a=d[1]\nelse:\n a=10")
0.10071221458065338
>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}", 
... stmt="if 2 in d:\n a=d[2]\nelse:\n a=10")
0.06966537335119938
Tim Pietzcker
fonte
3
Ainda não vejo por if/then que seria mais rápido. Ambos os casos requerem uma pesquisa de dicionário, ea menos que a invocação get()é assim muito mais lento, o que contas mais para a desaceleração?
Jens
1
@ Jens: Chamadas de função são caras.
Tim Pietzcker
1
O que não deve ser grande coisa em um dicionário densamente povoado, correto? Significando que a chamada de função não importará muito se a pesquisa real for cara. Provavelmente só importa em exemplos de brinquedos.
AturSams 14/05
2
@zehelvion: A pesquisa de dicionário é O(1)independente do tamanho do dicionário, portanto a sobrecarga da chamada de função é relevante.
Tim Pietzcker
35
é estranho que a sobrecarga de chamar uma função faça com que você decida não usar get. Use o que seus colegas de equipe podem ler melhor.
Jochen Bedersdorfer
19

Para vários padrões diferentes, tente o seguinte:

connectionDetails = { "host": "www.example.com" }
defaults = { "host": "127.0.0.1", "port": 8080 }

completeDetails = {}
completeDetails.update(defaults)
completeDetails.update(connectionDetails)
completeDetails["host"]  # ==> "www.example.com"
completeDetails["port"]  # ==> 8080
Jerome Baum
fonte
3
Esta é uma boa solução idiomática, mas há uma armadilha. Resultados inesperados podem resultar se connectionDetails for fornecido com Noneou emptyString como um dos valores nos pares de chave-valor. O defaultsdicionário pode potencialmente ter um de seus valores apagados acidentalmente. (veja também stackoverflow.com/questions/6354436 )
dreftymac
9

Há um método nos dicionários python para fazer isso: dict.setdefault

connectionDetails.setdefault('host',someDefaultValue)
host = connectionDetails['host']

No entanto, este método define o valor connectionDetails['host']para someDefaultValuese chave hostnão estiver definido, ao contrário do que a pergunta.

Sriram
fonte
1
Note-se que setdefault()o valor retorna, assim que isso funciona assim: host = connectionDetails.setdefault('host', someDefaultValue). Apenas tome cuidado para que ele defina connectionDetails['host']o valor padrão se a chave não estava lá antes.
ash108
7

(esta é uma resposta tardia)

Uma alternativa é subclassificar a dictclasse e implementar o __missing__()método, assim:

class ConnectionDetails(dict):
    def __missing__(self, key):
        if key == 'host':
            return "localhost"
        raise KeyError(key)

Exemplos:

>>> connection_details = ConnectionDetails(port=80)

>>> connection_details['host']
'localhost'

>>> connection_details['port']
80

>>> connection_details['password']
Traceback (most recent call last):
  File "python", line 1, in <module>
  File "python", line 6, in __missing__
KeyError: 'password'
Laurent LAPORTE
fonte
4

Testando a suspeita de @Tim Pietzcker sobre a situação no PyPy (5.2.0-alpha0) para o Python 3.3.5, acho que, de fato, ambos .get()e o if/ elseway têm desempenho semelhante. Na verdade, parece que no caso if / else existe apenas uma pesquisa se a condição e a atribuição envolverem a mesma chave (compare com o último caso em que há duas pesquisas).

>>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}",
.... stmt="try:\n a=d[1]\nexcept KeyError:\n a=10")
0.011889292989508249
>>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}",
.... stmt="try:\n a=d[2]\nexcept KeyError:\n a=10")
0.07310474599944428
>>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}",
.... stmt="a=d.get(1, 10)")
0.010391917996457778
>>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}",
.... stmt="a=d.get(2, 10)")
0.009348208011942916
>>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}",
.... stmt="if 1 in d:\n a=d[1]\nelse:\n a=10")
0.011475925013655797
>>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}",
.... stmt="if 2 in d:\n a=d[2]\nelse:\n a=10")
0.009605801998986863
>>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}",
.... stmt="if 2 in d:\n a=d[2]\nelse:\n a=d[1]")
0.017342638995614834
Até
fonte
1

Você pode usar uma função lamba para isso como uma linha. Faça um novo objeto connectionDetails2que seja acessado como uma função ...

connectionDetails2 = lambda k: connectionDetails[k] if k in connectionDetails.keys() else "DEFAULT"

Agora usa

connectionDetails2(k)

ao invés de

connectionDetails[k]

que retorna o valor do dicionário se kestiver nas chaves, caso contrário, retorna"DEFAULT"

Bobak Hashemi
fonte
I upvoted você, mas o problema com a sua solução é que dicts trabalho com [], mas o trabalho lambdas com ()
yukashima huksay