Verifique se a chave existe e itere a matriz JSON usando Python

130

Eu tenho um monte de dados JSON de postagens no Facebook como o abaixo:

{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}]}, "type": "status", "id": "id_7"}

Os dados JSON são semiestruturados e nem todos são iguais. Abaixo está o meu código:

import json 

str = '{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}]}, "type": "status", "id": "id_7"}'
data = json.loads(str)

post_id = data['id']
post_type = data['type']
print(post_id)
print(post_type)

created_time = data['created_time']
updated_time = data['updated_time']
print(created_time)
print(updated_time)

if data.get('application'):
    app_id = data['application'].get('id', 0)
    print(app_id)
else:
    print('null')

#if data.get('to'):
#... This is the part I am not sure how to do
# Since it is in the form "to": {"data":[{"id":...}]}

Eu quero que o código imprima o to_id como 1543 else print 'null'

Não sei ao certo como fazer isso.

pravi
fonte

Respostas:

162
import json

jsonData = """{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}]}, "type": "status", "id": "id_7"}"""

def getTargetIds(jsonData):
    data = json.loads(jsonData)
    if 'to' not in data:
        raise ValueError("No target in given data")
    if 'data' not in data['to']:
        raise ValueError("No data for target")

    for dest in data['to']['data']:
        if 'id' not in dest:
            continue
        targetId = dest['id']
        print("to_id:", targetId)

Resultado:

In [9]: getTargetIds(s)
to_id: 1543
inspectorG4dget
fonte
6
Por que essas inverificações explícitas e raisese elas estão ausentes? Basta acessá-lo sem verificar e você obterá exatamente o mesmo comportamento (exceto com um em KeyErrorvez de a ValueError).
22714 abarnert #
100

Se tudo o que você deseja é verificar se a chave existe ou não

h = {'a': 1}
'b' in h # returns False

Se você deseja verificar se existe um valor para a chave

h.get('b') # returns None

Retorne um valor padrão se o valor real estiver ausente

h.get('b', 'Default value')
por acaso
fonte
retornará 'null' e não 'Default value' conforme o esperado para b no caso de {'a': 1, 'b': null}
MikeL 28/11
16

É uma boa prática criar métodos de utilidade auxiliar para coisas assim, para que, sempre que você precise alterar a lógica da validação de atributo, ela esteja em um único local e o código seja mais legível para os seguidores.

Por exemplo, crie um método auxiliar (ou classe JsonUtilscom métodos estáticos) em json_utils.py:

def get_attribute(data, attribute, default_value):
    return data.get(attribute) or default_value

e depois use-o no seu projeto:

from json_utils import get_attribute

def my_cool_iteration_func(data):

    data_to = get_attribute(data, 'to', None)
    if not data_to:
        return

    data_to_data = get_attribute(data_to, 'data', [])
    for item in data_to_data:
        print('The id is: %s' % get_attribute(item, 'id', 'null'))

NOTA IMPORTANTE:

Há uma razão que estou usando, em data.get(attribute) or default_valuevez de simplesmente data.get(attribute, default_value):

{'my_key': None}.get('my_key', 'nothing') # returns None
{'my_key': None}.get('my_key') or 'nothing' # returns 'nothing'

Nos meus aplicativos, obter atributo com o valor 'null' é o mesmo que não obter o atributo. Se o seu uso for diferente, você precisará alterar isso.

MikeL
fonte
4
jsonData = """{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}, {"name": "Joe Schmoe"}]}, "type": "status", "id": "id_7"}"""

def getTargetIds(jsonData):
    data = json.loads(jsonData)
    for dest in data['to']['data']:
        print("to_id:", dest.get('id', 'null'))

Tente:

>>> getTargetIds(jsonData)
to_id: 1543
to_id: null

Ou, se você quiser apenas pular os valores dos IDs ausentes, em vez de imprimir 'null':

def getTargetIds(jsonData):
    data = json.loads(jsonData)
    for dest in data['to']['data']:
        if 'id' in to_id:
            print("to_id:", dest['id'])

Assim:

>>> getTargetIds(jsonData)
to_id: 1543

Obviamente, na vida real, você provavelmente não deseja printcada identificação, mas armazená-las e fazer algo com elas, mas isso é outra questão.

abarnert
fonte
4
if "my_data" in my_json_data:
         print json.dumps(my_json_data["my_data"])
Ajit Surendran
fonte
4

Eu escrevi uma pequena função para esse fim. Sinta-se livre para redirecionar,

def is_json_key_present(json, key):
    try:
        buf = json[key]
    except KeyError:
        return False

    return True
tabdiukov
fonte