Espécimes do Museu de Georreferenciamento com descrições ruins de localidade

10

Atualmente, estou coletando uma lista de espécimes de bancos de dados de vários museus de história natural para futuras pesquisas. No entanto, um problema conhecido associado à maioria dos dados históricos é a falta de latitude e longitude apropriadas, o que impede o uso desses dados.

Existem maneiras de superar esses dados - como desenhar um buffer em torno de uma região e fornecer uma gama de incertezas associadas a esse local.

Por exemplo, a função biogeomancer do pacote 'espacial' em R automatiza o processo de georreferenciamento, desde que haja algumas descrições textuais, como "2 milhas a oeste de XYZ". Veja a documentação aqui.

No entanto, minha principal preocupação é usar esse protocolo para regiões de até 200 quilômetros quadrados. Existe uma maneira de superar esse problema? Eu adoraria usar esse rico acervo de dados de museus, desde que eu possa lidar com a incerteza associada à sua localização.

Um exemplo de algumas amostras no meu conjunto de dados é mostrado abaixo. Observe que muitos deles vêm com menções de elevação, mas a maioria dos registros é muito vaga.

insira a descrição da imagem aqui

EDITAR

Na seção de comentários, um de vocês mencionou o objetivo desta pergunta e o que tento alcançar com a mesma.
1. Estou interessado em saber como é possível reduzir o raio de incerteza de uma região poligonal realmente ampla para um raio de incerteza menor (se possível).
2. Essas informações me ajudarão a realizar análises espaciais futuras, como modelagem de distribuição de espécies / modelagem de ocupação, por exemplo.

Vijay Ramesh
fonte
Você já ouviu falar do GBIF? gbif.org Talvez já tenha o que você está procurando.
GISKid
@GISKid Sim, esses são os dados do GBIF. Infelizmente, a maioria desses dados carece de bom georreferenciamento.
Vijay Ramesh
Pergunta interessante! No entanto, não está claro o que você espera fazer - os itens são georreferenciados, pois possuem informações de localização, embora para regiões poligonais. Você poderia editar e expandir como espera "lidar" com a questão dos polígonos grandes? É para ajudar com uma análise espacial?
Simbamangu #
1
Que método você está usando para o seu SDM? E qual o tamanho da área de estudo? Dependendo desses dois - eu pensaria que uma grande área de incerteza reduziria a utilidade de um SDM, pessoalmente. Em vez disso, eu eliminaria os dados que possuem um grande polígono de incerteza e continuaria usando ocorrências que são 'mais precisas'. Especialmente se # de ocorrências não é um problema
GISKid
2
Parece que você pode restringir, caso a caso , alguns dados de localidade - por exemplo, usando dados de elevação de varredura de 3500 '± 250' para mascarar dentro do polígono de Santhapara. Sem usar 'habilidades de detetive' e dados adicionais, você fica preso no centro do polígono - e (falando por experiência própria) isso é perigoso! Por quê? Agora você tem o que parece como dados de pontos precisos, mas não é, e isso pode se perder durante o compartilhamento ou etapas de análise.
Simbamangu 04/04

Respostas:

2

Considere as datas das ocorrências e tente obter (construir, georreferenciar) um mapa das estradas, linhas ferroviárias, pontes e cidades (vilarejos, estações de trem) conhecidas ou disponíveis na época para a região, pois o naturalista geralmente se afastava da região. uma vila conhecida e, pelo menos parcialmente, use uma estrada ou ferrovia existente para chegar às áreas onde eles obtiveram os espécimes. Às vezes, reduz realmente a área provável de coleta / ocorrência. Se houver mais informações ecológicas sobre as espécies, você pode excluir áreas, por exemplo. terras abertas versus florestas, terras úmidas versus terras secas, também com algumas informações auxiliares sobre a distribuição histórica desses ecossistemas.

Embora eu definitivamente não usasse esses locais para treinar o modelo sdm, você poderia usar os resultados do modelo para reduzir a incerteza de localização dessas ocorrências georreferenciadas em combinação com os dados mencionados acima.

Alguns artigos recentes abordam o efeito tendencioso desses locais incertos e, se usar dados ambientais resumidos, pode ser usado para compensar esse local impreciso:

Onde a incerteza posicional é um problema para a modelagem da distribuição de espécies? https://onlinelibrary.wiley.com/doi/pdf/10.1111/j.1600-0587.2013.00205.x

Quantificando o grau de viés do uso de dados em escala de condado na modelagem de distribuição de espécies: O aumento do tamanho da amostra ou o uso de dados ambientais médios de condado podem reduzir a predição de distribuição? https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5551104/

Priscilla Minotti
fonte
Obrigado pela sua resposta Priscilla. Atualmente, estou tentando obter mapas e dados históricos de cobertura do solo que fornecem informações sobre estradas e municípios. A esperança é fazer referência cruzada dessas informações com tags de espécimes de museus históricos para melhor referência geográfica. Embora o aspecto SDM não seja um problema importante, eu realmente gostaria de georeferenciá-los com precisão, pois quero amostrar essas amostras para análise genética. Alguma idéia sobre o último?
Vijay Ramesh