Esta é uma pergunta um tanto irreverente, mas tenho um interesse sério na resposta. Eu trabalho em um hospital psiquiátrico e tenho três anos de dados, coletados todos os dias em cada ala em relação ao nível de violência nessa ala.
Claramente, o modelo que se encaixa nesses dados é um modelo de série temporal. Eu tive que diferenciar as pontuações para torná-las mais normais. Ajustei um modelo ARMA com os dados diferenciados, e acho que o melhor ajuste foi um modelo com um grau de diferenciação e correlação automática de primeira ordem no atraso 2.
Minha pergunta é: para que diabos posso usar esse modelo? As séries temporais sempre parecem tão úteis nos livros didáticos quando se trata de populações de lebres e preços do petróleo, mas agora que fiz o meu próprio, o resultado parece tão abstrato que é completamente opaco. As pontuações diferenciadas se correlacionam no intervalo dois, mas não posso aconselhar a todos que estejam em alerta dois dias após um incidente grave com toda a seriedade.
Ou posso?
fonte
Respostas:
O modelo que se ajusta aos dados não precisa ser um modelo de série temporal; Eu recomendaria pensar um pouco fora da caixa.
Se você tiver várias variáveis (por exemplo, idade, sexo, dieta, etnia, doença, medicação), poderá usá-las para um modelo diferente. Talvez ter certos pacientes no mesmo quarto seja um preditor importante? Ou talvez tenha a ver com os funcionários presentes? Ou considere usar um modelo de série temporal multivariável (por exemplo, VECM) se você tiver outras variáveis que possa usar. Observe as relações entre a violência entre os pacientes: certos pacientes atuam juntos?
O modelo de série temporal é útil se o tempo tiver algum papel importante no comportamento. Por exemplo, pode haver um agrupamento de violência. Veja a literatura sobre agrupamentos de volatilidade. Como @Jonas sugere, com uma ordem de atraso de 2, talvez você precise estar em alerta máximo no dia seguinte a uma explosão de violência. Mas isso não ajuda a impedir o primeiro dia: pode haver outras informações que você pode vincular à análise para realmente entender a causa da violência, em vez de simplesmente divulgá-la como uma série temporal.
Por fim, como sugestão técnica: se você estiver usando R para a análise, poderá dar uma olhada no pacote de previsões de Rob Hyndman (o criador deste site). Isso tem muitos recursos muito bons; veja o artigo "Previsão automática de séries temporais: o pacote de previsão para R" no Journal of Statistical Software.
fonte
Você ajustou o modelo às diferenças, o que significa que está descrevendo a mudança nos níveis de violência. Você tem um atraso de 2 dias. Um atraso é indicativo da memória do processo. Em outras palavras, a mudança nos níveis de violência hoje tem alguma dependência da mudança nos níveis de violência nos últimos dois dias. Para escalas de tempo mais longas, a contribuição de influências aleatórias se torna forte o suficiente para que não haja mais um vínculo claro.
A correlação automática é positiva? Hoje, uma mudança nos níveis de violência sugere uma mudança semelhante nos níveis de violência em dois dias. Isso é negativo? Então a violência pode ficar mais alta por dois dias.
Obviamente, você pode querer controlar os efeitos confusos. Por exemplo, após um incidente sério, é provável que as pessoas relatem incidentes menores, mas essa "sensibilização" desapareceria após dois dias.
fonte