Atualmente, estou coletando uma lista de espécimes de bancos de dados de vários museus de história natural para futuras pesquisas. No entanto, um problema conhecido associado à maioria dos dados históricos é a falta de latitude e longitude apropriadas, o que impede o uso desses dados.
Existem maneiras de superar esses dados - como desenhar um buffer em torno de uma região e fornecer uma gama de incertezas associadas a esse local.
Por exemplo, a função biogeomancer do pacote 'espacial' em R automatiza o processo de georreferenciamento, desde que haja algumas descrições textuais, como "2 milhas a oeste de XYZ". Veja a documentação aqui.
No entanto, minha principal preocupação é usar esse protocolo para regiões de até 200 quilômetros quadrados. Existe uma maneira de superar esse problema? Eu adoraria usar esse rico acervo de dados de museus, desde que eu possa lidar com a incerteza associada à sua localização.
Um exemplo de algumas amostras no meu conjunto de dados é mostrado abaixo. Observe que muitos deles vêm com menções de elevação, mas a maioria dos registros é muito vaga.
EDITAR
Na seção de comentários, um de vocês mencionou o objetivo desta pergunta e o que tento alcançar com a mesma.
1. Estou interessado em saber como é possível reduzir o raio de incerteza de uma região poligonal realmente ampla para um raio de incerteza menor (se possível).
2. Essas informações me ajudarão a realizar análises espaciais futuras, como modelagem de distribuição de espécies / modelagem de ocupação, por exemplo.
fonte
Respostas:
Considere as datas das ocorrências e tente obter (construir, georreferenciar) um mapa das estradas, linhas ferroviárias, pontes e cidades (vilarejos, estações de trem) conhecidas ou disponíveis na época para a região, pois o naturalista geralmente se afastava da região. uma vila conhecida e, pelo menos parcialmente, use uma estrada ou ferrovia existente para chegar às áreas onde eles obtiveram os espécimes. Às vezes, reduz realmente a área provável de coleta / ocorrência. Se houver mais informações ecológicas sobre as espécies, você pode excluir áreas, por exemplo. terras abertas versus florestas, terras úmidas versus terras secas, também com algumas informações auxiliares sobre a distribuição histórica desses ecossistemas.
Embora eu definitivamente não usasse esses locais para treinar o modelo sdm, você poderia usar os resultados do modelo para reduzir a incerteza de localização dessas ocorrências georreferenciadas em combinação com os dados mencionados acima.
Alguns artigos recentes abordam o efeito tendencioso desses locais incertos e, se usar dados ambientais resumidos, pode ser usado para compensar esse local impreciso:
Onde a incerteza posicional é um problema para a modelagem da distribuição de espécies? https://onlinelibrary.wiley.com/doi/pdf/10.1111/j.1600-0587.2013.00205.x
Quantificando o grau de viés do uso de dados em escala de condado na modelagem de distribuição de espécies: O aumento do tamanho da amostra ou o uso de dados ambientais médios de condado podem reduzir a predição de distribuição? https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5551104/
fonte