Você pode ter ouvido falar sobre o recente surto de E. coli entero- hemorrágica
( EHEC )
na Alemanha .
Que perguntas um estatístico faria sobre a análise EHEC?
Estou pensando em perguntas e respostas entre repórteres / funcionários públicos, não especialistas, dizem professores e engenheiros com diploma de mestrado ou diploma, mas, no máximo, um punhado de estatísticas.
(É possível uma imagem, um mapa da área de EHEC mostrando várias cepas de EHEC e a cobertura de vários testes?)
Segunda-feira, 20 de junho: Pensei que o surto de EHEC seria uma área em que as estatísticas realmente importam para o mundo como um todo: quais são as evidências de várias causas, como elas podem ser comunicadas ao público? Então, iniciando uma recompensa.
data-visualization
teaching
denis
fonte
fonte
Respostas:
Se você não tem perguntas científicas a priori, deseja / precisa de respostas - eu examinaria a distribuição espacial dos casos. Em particular, eu estimaria um tipo de função espacial de "intensidade" - que é alguma função . Para que você não ajuste demais os dados, seria adequado um pouco de suavização, o que efetivamente "agruparia" os locais próximos. A abordagem mais simples seria usar uma função de estimativa de densidade do kernel (por exemplo, a função kde2d em R, embora possa ser necessário algum pré-processamento dos dados). Isso ajudaria a identificar "pontos quentes" na distribuição espacial e poderia levar um investigador a identificar os reservatórios ambientais de E. Coli.f( s ) = E( P r e v um l e n c e | y o u um r e i n l o c um t i o n s )
Dependendo dos outros dados que você possui, modelos espaciais mais sofisticados que se ajustam a fatores de confusão conhecidos podem ser usados.
fonte