Cópia profunda de um ditado em python

340

Eu gostaria de fazer uma cópia profunda de um dictem python. Infelizmente, o .deepcopy()método não existe para o dict. Como faço isso?

>>> my_dict = {'a': [1, 2, 3], 'b': [4, 5, 6]}
>>> my_copy = my_dict.deepcopy()
Traceback (most recent calll last):
  File "<stdin>", line 1, in <module>
AttributeError: 'dict' object has no attribute 'deepcopy'
>>> my_copy = my_dict.copy()
>>> my_dict['a'][2] = 7
>>> my_copy['a'][2]
7

A última linha deve ser 3.

Gostaria que as modificações my_dictnão afetassem o instantâneo my_copy.

Como faço isso? A solução deve ser compatível com o Python 3.x.

Olivier Grégoire
fonte
3
Não sei se é uma duplicata, mas esta: stackoverflow.com/questions/838642/python-dictionary-deepcopy está muito perto.
charleslparker

Respostas:

472

E se:

import copy
d = { ... }
d2 = copy.deepcopy(d)

Python 2 ou 3:

Python 3.2 (r32:88445, Feb 20 2011, 21:30:00) [MSC v.1500 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import copy
>>> my_dict = {'a': [1, 2, 3], 'b': [4, 5, 6]}
>>> my_copy = copy.deepcopy(my_dict)
>>> my_dict['a'][2] = 7
>>> my_copy['a'][2]
3
>>>
Lasse V. Karlsen
fonte
16
De fato, isso funciona para o exemplo simplificado que eu dei. Minhas chaves não são números, mas objetos. Se eu ler a documentação do módulo de cópia, tenho que declarar um método __copy __ () / __ deepcopy __ () para as chaves. Muito obrigado por me levar até lá!
Olivier Grégoire
3
Existe alguma diferença nos códigos Python 3.2 e 2.7? Eles parecem idênticos para mim.
Nesse
30
Também vale a pena mencionar que o copy.deepcopythread não é seguro. Aprendi isso da maneira mais difícil. Por outro lado, dependendo do seu caso de uso, json.loads(json.dumps(d)) é seguro para threads e funciona bem.
7267 rob
11
@rob, você deve postar esse comentário como resposta. É uma alternativa viável. A nuance de segurança da linha é uma distinção importante.
BuvinJ
3
@BuvinJ O problema é que json.loadsnão resolve o problema em todos os casos de uso em que os dictatributos python não são serializáveis ​​em JSON. Pode ajudar aqueles que estão lidando apenas com estruturas de dados simples, de uma API, por exemplo, mas não acho que seja uma solução suficiente para responder completamente à pergunta do OP.
rob
36

dict.copy () é uma função de cópia superficial para a
identificação do dicionário é a função interna que fornece o endereço da variável

Primeiro você precisa entender "por que esse problema específico está acontecendo?"

In [1]: my_dict = {'a': [1, 2, 3], 'b': [4, 5, 6]}

In [2]: my_copy = my_dict.copy()

In [3]: id(my_dict)
Out[3]: 140190444167808

In [4]: id(my_copy)
Out[4]: 140190444170328

In [5]: id(my_copy['a'])
Out[5]: 140190444024104

In [6]: id(my_dict['a'])
Out[6]: 140190444024104

O endereço da lista presente nos dois ditados da chave 'a' está apontando para o mesmo local.
Portanto, quando você altera o valor da lista em my_dict, a lista em my_copy também muda.


Solução para estrutura de dados mencionada na pergunta:

In [7]: my_copy = {key: value[:] for key, value in my_dict.items()}

In [8]: id(my_copy['a'])
Out[8]: 140190444024176

Ou você pode usar a cópia em profundidade, conforme mencionado acima.

theBuzzyCoder
fonte
4
Sua solução não funciona para dicionários aninhados. A cópia em profundidade é preferível por esse motivo.
22718 Charles Plager
2
@CharlesPlager Concordou! Mas você também deve observar que o fatiamento de lista não funciona no dict value[:]. A solução foi para a estrutura de dados específica mencionada na pergunta e não para uma solução universal.
precisa saber é o seguinte
17

Python 3.x

da cópia importada

my_dict = {'one': 1, 'two': 2}
new_dict_deepcopy = deepcopy(my_dict)

Sem a cópia em profundidade, não consigo remover o dicionário de nome de host do dicionário de domínio.

Sem a cópia em profundidade, recebo o seguinte erro:

"RuntimeError: dictionary changed size during iteration"

... quando tento remover o elemento desejado do meu dicionário dentro de outro dicionário.

import socket
import xml.etree.ElementTree as ET
from copy import deepcopy

domínio é um objeto de dicionário

def remove_hostname(domain, hostname):
    domain_copy = deepcopy(domain)
    for domains, hosts in domain_copy.items():
        for host, port in hosts.items():
           if host == hostname:
                del domain[domains][host]
    return domain

Exemplo de saída: [orginal] domínios = {'localdomain': {'localhost': {'all': '4000'}}}

[new] domínios = {'localdomain': {}}}

Então, o que está acontecendo aqui é que estou repetindo uma cópia de um dicionário, em vez de repetir o próprio dicionário. Com esse método, você pode remover elementos conforme necessário.

xpros
fonte
-2

Gosto e aprendi muito com Lasse V. Karlsen. Eu o modifiquei no exemplo a seguir, que destaca muito bem a diferença entre cópias de dicionário rasas e cópias profundas:

    import copy

    my_dict = {'a': [1, 2, 3], 'b': [4, 5, 6]}
    my_copy = copy.copy(my_dict)
    my_deepcopy = copy.deepcopy(my_dict)

Agora, se você mudar

    my_dict['a'][2] = 7

e fazer

    print("my_copy a[2]: ",my_copy['a'][2],",whereas my_deepcopy a[2]: ", my_deepcopy['a'][2])

você recebe

    >> my_copy a[2]:  7 ,whereas my_deepcopy a[2]:  3
Rafael Monteiro
fonte
Por que você acha que essa resposta é diferente da resposta de Lasse V. Karlsen ? O que acrescenta que a outra resposta não diz?
Olivier Grégoire
Olá Olivier! Não estou tentando tirar o mérito da resposta de Lasse V. Karlsen - ele basicamente resolveu o problema que eu tinha e estou em dívida com ele. Meu comentário não é diferente, é apenas complementar. Pela simples razão de que ele contrasta "copiar" com "cópia em profundidade". Essa foi a fonte do meu problema, pois me enganei ao usá-los de maneira equivalente. Felicidades.
Rafael Monteiro
-8

Uma solução mais simples (na minha opinião) é criar um novo dicionário e atualizá-lo com o conteúdo do antigo:

my_dict={'a':1}

my_copy = {}

my_copy.update( my_dict )

my_dict['a']=2

my_dict['a']
Out[34]: 2

my_copy['a']
Out[35]: 1

O problema dessa abordagem é que ela pode não ser "profunda o suficiente". isto é, não é recursivamente profundo. bom o suficiente para objetos simples, mas não para dicionários aninhados. Aqui está um exemplo em que pode não ser suficientemente profundo:

my_dict1={'b':2}

my_dict2={'c':3}

my_dict3={ 'b': my_dict1, 'c':my_dict2 }

my_copy = {}

my_copy.update( my_dict3 )

my_dict1['b']='z'

my_copy
Out[42]: {'b': {'b': 'z'}, 'c': {'c': 3}}

Usando Deepcopy (), posso eliminar o comportamento semi-superficial, mas acho que é preciso decidir qual abordagem é adequada para o seu aplicativo. Na maioria dos casos, você pode não se importar, mas deve estar ciente das possíveis armadilhas ... exemplo final:

import copy

my_copy2 = copy.deepcopy( my_dict3 )

my_dict1['b']='99'

my_copy2
Out[46]: {'b': {'b': 'z'}, 'c': {'c': 3}}
Eric Hoffman
fonte
12
Isso faz uma cópia superficial do ditado, que não é o que o questionador estava pedindo. Os objetos que ele contém não são copiados. E uma maneira mais fácil de copiar superficialmente é my_dict.copy()!
precisa saber é o seguinte