A ANOVA de efeitos fixos (ou seu equivalente de regressão linear) fornece uma poderosa família de métodos para analisar esses dados. Para ilustrar, aqui está um conjunto de dados consistente com as plotagens de média HC por noite (uma plotagem por cor):
| Color
Day | B G R | Total
-------+---------------------------------+----------
1 | 117 176 91 | 384
2 | 208 193 156 | 557
3 | 287 218 257 | 762
4 | 256 267 271 | 794
5 | 169 143 163 | 475
6 | 166 163 163 | 492
7 | 237 214 279 | 730
8 | 588 455 457 | 1,500
9 | 443 428 397 | 1,268
10 | 464 408 441 | 1,313
11 | 470 473 464 | 1,407
12 | 171 185 196 | 552
-------+---------------------------------+----------
Total | 3,576 3,323 3,335 | 10,234
ANOVA de count
contra day
e color
produz esta tabela:
Number of obs = 36 R-squared = 0.9656
Root MSE = 31.301 Adj R-squared = 0.9454
Source | Partial SS df MS F Prob > F
-----------+----------------------------------------------------
Model | 605936.611 13 46610.5085 47.57 0.0000
|
day | 602541.222 11 54776.4747 55.91 0.0000
colorcode | 3395.38889 2 1697.69444 1.73 0.2001
|
Residual | 21554.6111 22 979.755051
-----------+----------------------------------------------------
Total | 627491.222 35 17928.3206
O model
valor p de 0,0000 mostra que o ajuste é altamente significativo. O day
valor p de 0,0000 também é altamente significativo: você pode detectar alterações do dia a dia. No entanto, o color
valor de p (semestre) de 0,2001 não deve ser considerado significativo: você não pode detectar uma diferença sistemática entre os três semestres, mesmo após controlar a variação do dia a dia.
O teste HSD de Tukey ("diferença significativa honesta") identifica as seguintes alterações significativas (entre outras) nas médias diárias (independentemente do semestre) no nível 0,05:
1 increases to 2, 3
3 and 4 decrease to 5
5, 6, and 7 increase to 8,9,10,11
8, 9, 10, and 11 decrease to 12.
Isso confirma o que os olhos podem ver nos gráficos.
Como os gráficos saltam um pouco, não há como detectar correlações diárias (correlação serial), que é o ponto inteiro da análise de séries temporais. Em outras palavras, não se preocupe com as técnicas de séries temporais: não há dados suficientes aqui para fornecer uma visão maior.
Sempre se deve perguntar quanto acreditar nos resultados de qualquer análise estatística. Vários diagnósticos de heterocedasticidade (como o teste de Breusch-Pagan ) não mostram nada de ruim. Os resíduos não parecem muito normais - eles se agrupam em alguns grupos - então todos os valores de p devem ser tomados com um grão de sal. No entanto, eles parecem fornecer orientações razoáveis e ajudam a quantificar o sentido dos dados que podemos obter observando os gráficos.
Você pode executar uma análise paralela nos mínimos diários ou nos máximos diários. Certifique-se de começar com um gráfico semelhante ao guia e verificar a saída estatística.
Sarah, pegue seus 36 números (12 valores por ciclo; 3 ciclos) e construa um modelo de regressão com 11 indicadores refletindo o possível efeito da semana do semestre e, em seguida, identifique qualquer série de intervenção (pulsos, mudanças de nível) necessária para renderizar o a média dos resíduos seja 0,0 em todos os lugares ou, pelo menos, não seja estatisticamente diferente de 0,0. Por exemplo, se você identificar uma mudança de nível no período 13, isso pode sugerir uma diferença estatisticamente significativa entre a média do primeiro semestre, ou seja, os 12 primeiros valores) versus a média dos dois últimos semestres (últimos 24 valores). Você pode extrair inferência ou testar a hipótese de nenhuma semana do efeito do semestre. Um bom pacote de séries temporais pode ser útil a esse respeito. Caso não seja necessário encontrar alguém para fornecer ajuda nessa arena analítica.
fonte