Eu tenho um conjunto de dados que consiste em 247 armadilhas para mosquitos colocadas em posições fixas e amostradas semanalmente por 23 semanas. Também tenho dados de incidência de dengue (indexados ao endereço residencial) durante o mesmo período. Gostaria de ver se existe uma correlação espacial e espaço-temporal entre a taxa de captura de mosquitos em cada local da armadilha e a incidência de casos de dengue. Eu já tentei o I global da Moran e o I local da Moran na permutação espaço-tempo multivariada R e SaTScan. Nada disso parece me dar o que eu quero. Estou olhando para o lugar certo e apenas fazendo errado ou existem análises melhores que posso executar?
Muito obrigado pelo conselho!! Melhor, Amy Green
data
r
spatial-statistics
statistics
Amy verde
fonte
fonte
Respostas:
Eu acho que você está tentando estimar a eficácia do aprisionamento na redução da incidência de contração da dengue. Você pode querer dar uma olhada nos testes de interação espaço-tempo.
O PySAL possui várias implementações em seu módulo spatial_dynamics.
fonte
Os dados do mosquito são importantes? ou que tipo de variáveis você está lembrando nessas armadilhas? Vi um estudo em que eles usam o MaxEnt para prever leishmania no México pelos próximos 20 anos, usando apenas a presença dos locais da doença como dados. Não acho que seja muito confiável, mas é um ponto de partida e houve muitos desenvolvimentos. O que você está "procurando" algum tipo de krigagem permitiria entender a variabilidade espacial de suas variáveis. Você pode até executar algumas simulações se conseguir modelos que se encaixem bem. Tenho certeza de que existem técnicas de krigagem que funcionam em um contexto de tempo espacial, mas nunca as usei. Uma rápida pesquisa no Google deve lançar algumas referências. 23 semanas não são muitos pontos de dados para análise de séries temporais, mas você pode experimentá-lo, o pacote R bfast permite detectar quebras abruptas no comportamento de uma série temporal, talvez você possa detectar essas anomalias e associá-las a surtos de dengue. Eu acho que você precisa produzir uma descrição melhor do seu problema e dos resultados desejados do estudo.
fonte
Difícil dizer sem ver seus dados e trabalhar com algumas análises exploratórias. Mais alguns detalhes sobre hipóteses, desenho da amostra e dados reais coletados seriam bem-vindos. Ao fazer perguntas sobre metodologia estatística, é importante que você indique a hipótese que está testando. Isso pode ditar a metodologia estatística e, sem saber, estamos atirando no escuro.
Também não está claro qual é o problema com as estatísticas especificadas em relação a "não me dar o que quero". Não sei o que você esperava com uma estatística de autocorrelação univariada indicando uma correlação espacial bivariada. A família de estatísticas SCAN é bastante variável, com muitas distribuições definidas disponíveis. Que distribuição (modelo) você definiu no SaTScan e você realmente tem uma hipótese e dados adequados para uma análise de padrão de pontos? Geralmente, uma amostra sistemática e quadriculada não é apropriada para uma análise de padrão de pontos.
Uma correlação seria muito limitadora do ponto de vista inferencial e parece que um modo de regressão está em ordem aqui. À primeira vista, eu pensaria que um modelo de efeitos mistos com um termo AR-I para o tempo e um termo de autocorrelação para os efeitos aleatórios espaciais atenderiam às suas necessidades. Isso permitiria que você particionasse a variação por tempo e normalizasse qualquer influência que a autocorrelação tivesse sobre erro residual e suposições de iid. Outra opção, se os dados o suportassem, seria um modelo de processo de ponto de Poisson em uma estrutura do MCMC. Se especificado como um modelo hierárquico, você poderá definir o tempo como anterior. Com uma abordagem de regressão do kernel, você pode testar várias hipóteses de processos de difusão espacial ou definir um termo de difusão quadrática. Esse tipo de modelo é comumente usado em epidemiologia espacial para obter a taxa de propagação.
É fácil se perder "jogando seus dados contra a parede" com abordagens estatísticas espaciais, mas, a menos que o design da amostra tenha como objetivo capturar o processo espacial e você tenha uma pergunta bem formulada sobre o efeito espacial, esse pode ser um exercício fútil.
Devido à fácil disponibilidade de metodologias, os métodos frequentistas são frequentemente ignorados. Existem modelos de regressão disponíveis que podem lidar prontamente com dados espaciais (regressão espacial e autorregressiva condicional, regressão espacial, regressão polinomial, modelos de efeitos mistos, regressão canônica, regressão de kernel, regressões semi e não paramétricas, ...) e se você pretende inferência, estes devem ser explorados em relação à sua hipótese.
fonte