Estou interessado em aprender como desenvolver uma aproximação geográfica de algum tipo de epicentro com base nos dados do surto de John Snow Cholera. Que modelagem estatística poderia ser usada para resolver esse problema sem o conhecimento prévio de onde os poços estão localizados.
Como um problema geral, você teria disponível a hora, a localização dos pontos conhecidos e o caminho a pé do observador. O método que estou procurando usaria essas três coisas para estimar o epicentro do "surto".
bayesian
spatial
epidemiology
gis
cylondude
fonte
fonte
Respostas:
Não para dar uma resposta completa ou autoritária, mas apenas para estimular idéias, relatarei uma análise rápida que fiz para um exercício de laboratório em um curso de estatísticas espaciais que estava ministrando há dez anos. O objetivo era ver que efeito uma contabilidade precisa das possíveis rotas de viagem (a pé), em comparação com o uso das distâncias euclidianas, teria um método exploratório relativamente simples: uma estimativa da densidade do núcleo. Onde o pico (ou picos) da densidade seria relativo à bomba cuja manivela Snow removeu?
Usando uma representação rasterizada de alta resolução (2946 linhas por 3160 colunas) do mapa de Snow (devidamente georreferenciada), digitalizei cada uma das centenas de pequenos caixões pretos mostrados no mapa (encontrando 558 deles em 309 endereços), atribuindo cada um a a extremidade da rua correspondente ao seu endereço e resumindo por endereço em uma contagem em cada local.
Após algum processamento de imagem para identificar as ruas e os becos, realizei uma difusão gaussiana simples, limitada a essas áreas (usando meios focais repetidos em um SIG). Este é o KDE.
O resultado fala por si - dificilmente precisa de uma lenda para explicá-lo. (O mapa mostra muitas outras bombas, mas todas ficam fora dessa visão, que se concentra nas áreas de maior densidade.)
fonte
Em [1, §3.2], David Freedman sugere uma resposta essencialmente negativa à sua pergunta. Ou seja, nenhum (mero) modelo estatístico ou algoritmo poderia resolver o problema de John Snow. O problema de Snow era desenvolver um argumento crítico que apóia sua teoria de que o cólera é uma doença infecciosa transmitida pela água, contra a teoria predominante do miasma de seus dias. (O capítulo 3 de [1], intitulado “Modelos estatísticos e couro de sapato”, também está disponível no formulário publicado anteriormente [2] aqui .)
Nestas poucas páginas curtas [1, pp.47-53], grande parte das quais é uma citação extensa do próprio John Snow, Freedman argumenta que "o que Snow realmente fez em 1853-54 é ainda mais interessante do que a fábula [do Broad Street Pump]. " No que se refere à coleta de evidências estatísticas (outras preliminares, como identificação de casos de índice etc.), Snow explorou a variação natural para efetuar um quase-experimento verdadeiramente notável.
Acontece que, em um período anterior, havia uma vigorosa competição entre as empresas de abastecimento de água em Londres, e isso resultou na mistura espacial do suprimento de água que era (nas palavras de Snow) "do tipo mais íntimo".
Outra parte criticamente importante da "variação natural" que John Snow explorou nesse quase experimento foi que uma empresa de água teve sua ingestão de água no Tamisa a jusante das descargas de esgoto , enquanto a outra havia alguns anos antes de realocar sua ingestão a montante . Vou deixar você adivinhar qual era a tabela de dados de John Snow!
Como Freedman observa secamente,
Um outro ponto de variação natural explorada por Snow ocorreu na dimensão temporal : a referida mudança de ingestão de água ocorreu entre duas epidemias, permitindo à Snow comparar a água da mesma empresa com e sem adição de esgoto. (Obrigado a Philip B. Stark, um autor de [1], por esta informação via Twitter . Veja esta palestra on-line dele).
Esse assunto também fornece um estudo instrutivo sobre o contraste entre dedutivismo e indutivismo , conforme discutido nesta resposta .
Freedman D, Collier D, Sekhon JS, Stark PB. Modelos estatísticos e inferência causal: um diálogo com as ciências sociais. Cambridge; Nova York: Cambridge University Press; 2010.
Freedman DA. Modelos Estatísticos e Calçados de Couro. Metodologia Sociológica . 1991; 21: 291-313. doi: 10.2307 / 270939. Texto completo
fonte