Existem algumas vozes fortes na comunidade Econometrics contra a validade da estatística Ljung-Box para testar autocorrelação com base nos resíduos de um modelo autoregressivo (isto é, com variáveis dependentes defasadas na matriz regressora), ver particularmente Maddala (2001) "Introdução à Econometria (edição 3d), cap. 6.7 e 13. 5 p 528. Maddala literalmente lamenta o uso generalizado desse teste e, em vez disso, considera apropriado o teste" Langrange Multiplicador "de Breusch e Godfrey.Q
O argumento de Maddala contra o teste de Ljung-Box é o mesmo que o apresentado contra outro teste de autocorrelação onipresente, o de "Durbin-Watson": com variáveis dependentes defasadas na matriz do regressor, o teste é enviesado a favor de manter a hipótese nula de "sem autocorrelação" (os resultados de Monte-Carlo obtidos na resposta @javlacalle aludem a esse fato). Maddala também menciona a baixa potência do teste, ver, por exemplo , Davies, N., & Newbold, P. (1979). Alguns estudos de potência de um teste portmanteau de especificação de modelo de série temporal. Biometrika, 66 (1), 153-155 .
Hayashi (2000) , cap. 2.10 "Teste para correlação serial" , apresenta uma análise teórica unificada e, acredito, esclarece o assunto. Hayashi começa do zero: para que aestatísticaLjung-Boxseja distribuída assintoticamente como um qui-quadrado, deve ser o caso do processo(qualquer que seja orepresenta), cujas autocorrelações de amostra são alimentadas na estatística é, sob a hipótese nula de não autocorrelação, uma seqüência de diferença de martingale, ou seja, que satisfaz{ z t } zQ{zt}z
E(zt∣zt−1,zt−2,...)=0
e também exibe homoskedasticity condicional "próprio"
E(z2t∣zt−1,zt−2,...)=σ2>0
Nessas condições, a estatística Ljung-Box (que é uma variante corrigida para amostras finitas da estatística original de Box-Pierce ), possui assintoticamente uma distribuição qui-quadrado e seu uso tem justificação assintótica. QQQ
Suponha agora que especificamos um modelo autoregressivo (que talvez inclua também regressores independentes além de variáveis dependentes defasadas), digamos
yt=x′tβ+ϕ(L)yt+ut
onde é um polinômio no operador lag, e queremos testar a correlação serial usando os resíduos da estimativa. Então aqui . z t ≡ u tϕ(L)zt≡u^t
Hayashi mostra que, para que a estatística Ljung-Box com base nas autocorrelações amostrais dos resíduos, tenha uma distribuição qui-quadrado assintótica sob a hipótese nula de ausência de autocorrelação, deve ser o caso de todos os regressores serem "estritamente exógenos" " ao termo do erro no seguinte sentido:Q
E(xt⋅us)=0,E(yt⋅us)=0∀t,s
O "para todos os " é o requisito crucial aqui, aquele que reflete estrita exogeneidade. E isso não se aplica quando existem variáveis dependentes atrasadas na matriz regressora. Isso é facilmente visto: defina e depoiss = t - 1t,ss=t−1
E[ ytvocêt - 1] = E[ ( x′tβ+ ϕ ( L ) yt+ ut) ut - 1] =
E[ x′tβ⋅ ut - 1] + E[ Φ ( L ) yt⋅ ut - 1] + E[ ut⋅ ut - 1] ≠ 0
mesmo que os sejam independentes do termo de erro e mesmo que o termo de erro não tenha autocorrelação : o termo não é zero. E [ φ ( L ) y t ⋅ u t - 1 ]XE[ Φ ( L ) yt⋅ ut - 1]
Mas isso prova que a estatística Ljung-Box não é válida em um modelo autoregressivo, porque não se pode dizer que tenha uma distribuição qui-quadrado assintótica sob o valor nulo.Q
Suponha agora que uma condição mais fraca do que estrita exogeneidade seja satisfeita, a saber:
E( ut∣ xt, xt - 1, . . . , ϕ ( L ) yt, ut - 1, ut - 2, . . . ) = 0
A força dessa condição está "entre" estrita exogeneidade e ortogonalidade. Sob o nulo de nenhuma autocorrelação do termo de erro, essa condição é "automaticamente" satisfeita por um modelo auto-regressivo, com relação às variáveis dependentes defasadas (para os , é claro que deve ser assumido separadamente).X
Então, existe outra estatística baseada nas autocorrelações residuais da amostra ( não a Ljung-Box), que possui uma distribuição qui-quadrado assintótica sob o valor nulo. Essa outra estatística pode ser calculada, como uma conveniência, usando a rota "regressão auxiliar": regride os resíduos na matriz regressiva completa e nos resíduos passados (até o atraso que usamos na especificação ), obter o uncentered a partir desta regressão auxiliar e multiplicá-la pelo tamanho da amostra.R 2{ u^t} R2
Essa estatística é usada no que chamamos de "teste de Breusch-Godfrey para correlação serial" .
Parece então que, quando os regressores incluem variáveis dependentes defasadas (e também em todos os casos de modelos auto-regressivos), o teste de Ljung-Box deve ser abandonado em favor do teste de Breusch-Godfrey LM. , não porque "ele apresenta desempenho pior", mas porque não possui justificativa assintótica. Um resultado bastante impressionante, especialmente a julgar pela presença onipresente e aplicação do primeiro.
ATUALIZAÇÃO: Respondendo às dúvidas levantadas nos comentários sobre se todas as alternativas acima se aplicam também a modelos de séries temporais "puras" ou não (ou seja, sem registradores " "), publiquei um exame detalhado do modelo AR (1), em https://stats.stackexchange.com/a/205262/28746 .x
Conjetura
Não conheço nenhum estudo comparando esses testes. Suspeitei que o teste de Ljung-Box seja mais apropriado no contexto de modelos de séries temporais como os modelos ARIMA, em que as variáveis explicativas são defasagens das variáveis dependentes. O teste de Breusch-Godfrey poderia ser mais apropriado para um modelo de regressão geral em que as suposições clássicas são atendidas (em particular, regressores exógenos).
Minha suposição é que a distribuição do teste de Breusch-Godfrey (que se baseia nos resíduos de uma regressão ajustada pelos mínimos quadrados ordinários) pode ser afetada pelo fato de que as variáveis explicativas não são exógenas.
Fiz um pequeno exercício de simulação para verificar isso e os resultados sugerem o oposto: o teste de Breusch-Godfrey tem um desempenho melhor que o teste de Ljung-Box ao testar a autocorrelação nos resíduos de um modelo autoregressivo. Detalhes e código R para reproduzir ou modificar o exercício são fornecidos abaixo.
Exercício de simulação pequeno
Uma aplicação típica do teste de Ljung-Box é testar a correlação serial nos resíduos de um modelo ARIMA instalado. Aqui, eu gero dados de um modelo AR (3) e ajusto um modelo AR (3).
Os resíduos satisfazem a hipótese nula de não autocorrelação; portanto, esperamos valores de p uniformemente distribuídos. A hipótese nula deve ser rejeitada em uma porcentagem de casos próximos ao nível de significância escolhido, por exemplo, 5%.
Teste de Ljung-Box:
Os resultados mostram que a hipótese nula é rejeitada em casos muito raros. Para um nível de 5%, a taxa de rejeições é muito inferior a 5%. A distribuição dos valores p mostra um viés em direção à não rejeição do nulo.
Editar Em princípio,
fitdf=3
deve ser definido em todos os casos. Isso explicará os graus de liberdade que são perdidos após o ajuste do modelo AR (3) para obter os resíduos. No entanto, para defasagens de ordem inferiores a 4, isso levará a graus negativos ou nulos de liberdade, tornando o teste inaplicável. De acordo com a documentação?stats::Box.test
: Às vezes, esses testes são aplicados aos resíduos de um ajuste ARMA (p, q) .fitdf = p+q
Nesse caso, as referências sugerem uma melhor aproximação à distribuição de hipóteses nulas é obtida por ajuste , desde que seja clarolag > fitdf
.Teste de Breusch-Godfrey:
Os resultados do teste Breusch-Godfrey parecem mais sensatos. Os valores de p são distribuídos uniformemente e as taxas de rejeição estão mais próximas do nível de significância (conforme esperado na hipótese nula).
fonte
LB.pvals[i,j]
para : não Ljung-Box testando faz sentido para dado que um modelo AR (3) com 3 coeficientes estava apto ( )? Caso contrário, os resultados ruins do teste Ljung-Box para não são surpreendentes. j ⩽ 3 j ∈ { 1 , 2 , 3 }fitdf=3
lag<fitdf
fitdf=0
no lugar defitdf=3
você, pode estar se enganando.Greene (Econometric Analysis, 7ª edição, p. 963, seção 20.7.2):
(Eu sei que a pergunta é sobre a Ljung-Box e a descrição acima se refere à Box-Pierce, mas a primeira é um refinamento simples da última e, portanto, qualquer comparação entre GB e BP também se aplicaria a uma comparação entre GB e LB.)
Como outras respostas já explicaram de maneira mais rigorosa, Greene também sugere que não há nada a ganhar (exceto alguma eficiência computacional) ao usar Ljung-Box versus Godfrey-Breusch, mas potencialmente muito a perder (a validade do teste).
fonte
Parece que os testes Box-Pierce e Ljung-Box são principalmente testes univariados, mas existem algumas suposições por trás do teste de Breusch-Godfrey ao testar se a estrutura linear é deixada para trás em resíduos de regressão de séries temporais (processo MA ou AR).
Aqui está o link para a discussão:
http://www.stata.com/meeting/new-orleans13/abstracts/materials/nola13-baum.pdf
fonte
A principal diferença entre os testes é a seguinte:
O teste Breusch-Godfrey é o teste multiplicador de Lagrange derivado da função de probabilidade (corretamente especificada) (e, portanto, dos primeiros princípios).
O teste de Ljung-Box é baseado em segundos momentos dos resíduos de um processo estacionário (e, portanto, de natureza comparativamente mais ad-hoc).
O teste de Breusch-Godfrey é o teste multiplicador de Lagrange assintoticamente equivalente ao teste uniformemente mais poderoso. Seja como for, é apenas assintoticamente mais poderosa a hipótese alternativa dos regressores omitidos (independentemente de serem variáveis atrasadas ou não). O ponto forte do teste de Ljung-Box pode ser seu poder contra uma ampla gama de hipóteses alternativas.
fonte