Usando a análise de séries temporais para analisar / prever comportamentos violentos

13

Esta é uma pergunta um tanto irreverente, mas tenho um interesse sério na resposta. Eu trabalho em um hospital psiquiátrico e tenho três anos de dados, coletados todos os dias em cada ala em relação ao nível de violência nessa ala.

Claramente, o modelo que se encaixa nesses dados é um modelo de série temporal. Eu tive que diferenciar as pontuações para torná-las mais normais. Ajustei um modelo ARMA com os dados diferenciados, e acho que o melhor ajuste foi um modelo com um grau de diferenciação e correlação automática de primeira ordem no atraso 2.

Minha pergunta é: para que diabos posso usar esse modelo? As séries temporais sempre parecem tão úteis nos livros didáticos quando se trata de populações de lebres e preços do petróleo, mas agora que fiz o meu próprio, o resultado parece tão abstrato que é completamente opaco. As pontuações diferenciadas se correlacionam no intervalo dois, mas não posso aconselhar a todos que estejam em alerta dois dias após um incidente grave com toda a seriedade.

Ou posso?

Chris Beeley
fonte
você poderia editar o título para algo como "Usando a análise de séries temporais para analisar / prever comportamentos violentos"?
Paulo
1
Eu realmente gosto desse tipo de pergunta, acho que esse tipo de problema real de worl preciso aumentará o interesse do site. Seria ainda melhor se você tivesse a possibilidade de adicionar um link aos dados ou nos contar (como um complemento para o post) o que você finalmente fez, quais foram as conclusões .... no entanto, eu entendo que isso pode ser confidencial ...
robin girard
I whish eu poderia votar novamente para fazer você passar sobre a pergunta sobre a definição de uma variável aleatória;)
Girard robin
Voltarei para lhe dizer quais foram os resultados, mas levará um tempo enquanto estou trabalhando nisso, juntamente com muitas outras tarefas. Não sabia ao certo o que você quis dizer com "ignorar a pergunta sobre variável aleatória"? Existe uma pergunta que você recomenda que eu analise?
22610 Chris Beeley
desculpe se eu não estava claro, não quero que eu prefira perguntas (opiniões subjetivas pessoais) como a sua do que a pergunta que pergunta "o que é uma variável aleatória" ... mas acho que meu prazer não é o de todos :)
22610 Robinson Girard

Respostas:

9

O modelo que se ajusta aos dados não precisa ser um modelo de série temporal; Eu recomendaria pensar um pouco fora da caixa.

Se você tiver várias variáveis ​​(por exemplo, idade, sexo, dieta, etnia, doença, medicação), poderá usá-las para um modelo diferente. Talvez ter certos pacientes no mesmo quarto seja um preditor importante? Ou talvez tenha a ver com os funcionários presentes? Ou considere usar um modelo de série temporal multivariável (por exemplo, VECM) se você tiver outras variáveis ​​que possa usar. Observe as relações entre a violência entre os pacientes: certos pacientes atuam juntos?

O modelo de série temporal é útil se o tempo tiver algum papel importante no comportamento. Por exemplo, pode haver um agrupamento de violência. Veja a literatura sobre agrupamentos de volatilidade. Como @Jonas sugere, com uma ordem de atraso de 2, talvez você precise estar em alerta máximo no dia seguinte a uma explosão de violência. Mas isso não ajuda a impedir o primeiro dia: pode haver outras informações que você pode vincular à análise para realmente entender a causa da violência, em vez de simplesmente divulgá-la como uma série temporal.

Por fim, como sugestão técnica: se você estiver usando R para a análise, poderá dar uma olhada no pacote de previsões de Rob Hyndman (o criador deste site). Isso tem muitos recursos muito bons; veja o artigo "Previsão automática de séries temporais: o pacote de previsão para R" no Journal of Statistical Software.

Shane
fonte
1
Concordado - apenas para lançar algumas idéias adicionais sobre modelagem: logística para prever quais pacientes terão mais de 1 explosão violenta, regressão de Poisson (esque) para prever quais pacientes terão muitas explosões, multinível para examinar variações de sala para sala e / ou enfermaria ...
Matt Parker
1
+1 É fácil ficar cego pelas exortações para não usar modelos lineares, etc., em séries temporais por causa de problemas de correlação automática, e ficar preso no ARIMA, DLM, etc., quando LM, GLM, etc. podem ser bastante poderosos com um pouco de cautela.
91111 Wayne
6

Você ajustou o modelo às diferenças, o que significa que está descrevendo a mudança nos níveis de violência. Você tem um atraso de 2 dias. Um atraso é indicativo da memória do processo. Em outras palavras, a mudança nos níveis de violência hoje tem alguma dependência da mudança nos níveis de violência nos últimos dois dias. Para escalas de tempo mais longas, a contribuição de influências aleatórias se torna forte o suficiente para que não haja mais um vínculo claro.

A correlação automática é positiva? Hoje, uma mudança nos níveis de violência sugere uma mudança semelhante nos níveis de violência em dois dias. Isso é negativo? Então a violência pode ficar mais alta por dois dias.

Obviamente, você pode querer controlar os efeitos confusos. Por exemplo, após um incidente sério, é provável que as pessoas relatem incidentes menores, mas essa "sensibilização" desapareceria após dois dias.

Jonas
fonte