Informações relacionadas ao GIS Governança [fechado]

22

Costumo trabalhar no mapeamento de dados sensíveis no nível do paciente. Enquanto sinto que tenho uma boa compreensão de muitos dos problemas de governança em torno disso (por exemplo, quando usar as técnicas de binning e k-anonimato ), mas gostaria de melhorar meu conhecimento sobre isso.

Aqui está um bom exemplo de por que isso é importante: confidencialidade espacial e SIG: reengenharia de locais de mortalidade a partir de mapas publicados sobre o furacão Katrina

Alguém tem alguma boa regra prática ao mapear dados confidenciais?

Existem bons recursos por aí que abranjam diferentes métodos de proteção à confidencialidade ou forneçam orientações sobre o assunto?

Tumbledown
fonte
2
+1 (aliás, um método de anonimato de dados sugerido em um thread anterior aparece em gis.stackexchange.com/questions/31236/… ) Você poderia esclarecer o que quer dizer com "regras básicas"? Você procura soluções técnicas para ocultar os detalhes dos dados ou está procurando orientação sobre quando e por quanto os dados devem ser protegidos?
whuber
1
Soluções principalmente técnicas, embora orientações sobre o nível de proteção também sejam úteis. Eu os vejo indo de mãos dadas. Por exemplo, dados muito sensíveis que consistem em muitos números pequenos devem ser exibidos usando a técnica X ou Y, se as informações demográficas forem incluídas. Eu estava pensando em usar o bin hexadecimal para uma tarefa, mas de repente pensei que não tinha ideia da população em cada hexágono. E se eu exibisse um valor de 20 e descobrisse que havia apenas 20 residentes nesse hexágono? Também ouvi recentemente sobre o problema da unidade aérea modificável relacionado a isso.
Tumbledown
Votei em fechar isso como muito amplo, porque ele está buscando uma lista de "regras básicas" e uma lista de recursos.
PolyGeo

Respostas:

8

Essa discussão é extremamente necessária na profissão de SIG, e eu culpei bastante o ensino superior por negligenciar esse tópico.

Dito isto, aqui está uma literatura interessante, se não desatualizada, sobre o assunto. O único consenso real entre esses recursos é que não há consenso na profissão de SIG em relação à privacidade pessoal, mas deve ser uma grande preocupação.

Ética do SIG | Jeremy Crampton

Protegendo a privacidade pessoal no uso de sistemas de informações geográficas | Harlan J. Onsrud, Jeff P. Johnson e Xavier Lopez | LINK ATUALIZADO 1/11/17

Privacidade e confidencialidade em saúde GIS | LINK ATUALIZADO 1/11/17

Sean Adkins
fonte
1
Votou isso como realmente ressalta a dificuldade inerente (ainda) a essa área. Pickles realmente (e de propósito) abriu uma lata de vermes tão grande com suas observações que é quase impossível abordar todos os atos possíveis de não divulgação. Sempre existe o problema espinhoso do conhecimento contextual que influencia uma reivindicação de divulgação, bem como o conhecimento aplicado de fora do recurso original que pode ser usado para identificar um indivíduo. Hashing de dados ou pontos de deslocamento espacial nunca podem negar esses problemas em potencial. Então você praticamente deixou sua própria postura ética!
Andrew Tice
Os procedimentos padrão de anonimato tendem a fazer suposições sobre populações normalmente distribuídas, quando a maioria das análises espaciais tende a estar longe de ser normalmente distribuída. A criação de varredura ajuda um pouco a ofuscar a precisão percebida das saídas, portanto, isso pode ser considerado para uma apresentação geral. A pergunta original mencionava o MAUP, e certamente usar alguma forma de SCAM em diferentes níveis espaciais poderia ajudar, embora possa valer a pena acabar com algo como o GAM de Openshaw?
Andrew Tice
1
@AndrewTice Posso perguntar o que é SCAM? Minhas habilidades de descriptografia me abandonaram hoje!
Decrescente
1
@Tumbledown - Desculpe! Significa Small Cell Adjustment Method. Se você pesquisar no Google na íntegra, encontrará literatura do ONS no Reino Unido. É um dos métodos testados e aprovados para relatórios de Censo de pequeno nível, por isso é aplicado para contagens de unidades de área. É um pouco brutal, mas como o ONS o utilizou amplamente, há algumas justificativas para aplicar o método.
Andrew Tice
1
Caramba! Sempre chatice ao fazer referência a materiais mais antigos. Vou tentar encontrar links de trabalho e editar minha postagem adequadamente. Obrigado!
Sean Adkins
4

Estas são as regras dadas pelo Eurostat quando solicita informar as localizações das explorações. Os locais são relatados com coordenadas arredondadas e, em certos casos, aplicando um deslocamento semi-aleatório adicional. Não sei se eles dão uma boa regra de ouro, mas pelo menos essas regras são usadas por uma autoridade européia conhecida.

No que diz respeito à localização da exploração, são aplicados dois princípios: (i) não são necessárias coordenadas precisas; e (ii) um local com apenas uma exploração será recodificado.

(i) coordenadas precisas não são necessárias: as coordenadas de longitude e latitude não serão necessárias em termos de segundos ou frações decimais de minutos. Será necessário fornecer a localização apenas nos 5 minutos mais próximos, o que representa uma área de aproximadamente 3.000 a 7.000 ha, dependendo da localização na Europa.

ii) um local com apenas uma exploração será recodificado: é possível que em áreas com propriedades muito grandes, o local especificado para os 5 minutos de longitude e latitude mais próximos possa conter apenas uma exploração que, portanto, seria diretamente identificável. Para garantir que a identificação direta não possa ocorrer, a localidade com apenas uma exploração deve ser alocada no ponto vizinho mais próximo (escolhido aleatoriamente) com pelo menos uma outra exploração. Se qualquer um dos 8 locais vizinhos não tiver pelo menos uma propriedade, os locais vizinhos deverão ser estendidos até que outros estejam localizados com pelo menos uma outra propriedade. Contudo, sempre que possível, a exploração agrícola deve ser atribuída à região NUTS 3 onde está situada.

user30184
fonte
1

Pensei em colocar este site útil como um link adicional: Rede de Anonimização do Reino Unido

Não é específico do SIG e visa o Reino Unido, mas fornece algumas informações e recursos úteis para mitigar o risco de divulgação.

Eles também administram uma série de oficinas e clínicas gratuitas de anonimização

Tumbledown
fonte
Outro link útil, um quadro tomada de decisão a partir UKAN: ukanon.net/ukan-resources/ukan-decision-making-framework
Tumbledown