As consequências da heterocedasticidade são:
O estimador de mínimos quadrados ordinários (OLS) ainda é consistente, mas não é mais eficiente .b^=(X′X)X′y
A estimativa que não é mais um estimador consistente para a matriz de covariância do seu estimador . Pode ser enviesado e inconsistente. E, na prática, pode subestimar substancialmente a variação.Var^(b)=(X′X)−1σ^2σ^2=1n−ke′eb^
O ponto (1) pode não ser um problema importante; as pessoas geralmente usam o estimador OLS comum de qualquer maneira. Mas o ponto (2) deve ser abordado. O que fazer?
Você precisa de erros padrão consistentes em heterocedasticidade . A abordagem padrão é basear-se em suposições de grandes amostras, resultados assintóticos e estimar a variação de usando:b
SS=1
Var^(b)=1n(X′Xn)−1S(X′Xn)−1
que é estimado como .
SS=1n−k∑i(xiei)(xiei)′
Isso fornece erros padrão consistentes em heterocedasticidade. Eles também são conhecidos como erros padrão do Huber-White, erros padrão robustos, estimador "sanduíche", etc ... Qualquer pacote básico de estatísticas padrão tem uma opção para erros padrão robustos. Use-o!
Alguns comentários adicionais (atualização)
Se a heterocedasticidade for grande o suficiente, a estimativa OLS regular pode ter grandes problemas práticos. Embora ainda seja um estimador consistente, você pode ter pequenos problemas de amostra, onde toda a sua estimativa é conduzida por algumas observações de alta variação. (Isto é o que @ seanv507 está fazendo alusão nos comentários). O estimador OLS é ineficiente, pois está dando mais peso às observações de alta variação do que o ideal. A estimativa pode ser extremamente barulhenta.
Um problema ao tentar corrigir a ineficiência é que você provavelmente também não conhece a matriz de covariância para os termos de erro, portanto, usar algo como GLS pode piorar ainda mais as coisas se sua estimativa do termo de erro matriz de covariância for lixo.
Além disso, os erros padrão de Huber-White que forneci acima podem ter grandes problemas em pequenas amostras. Há uma longa literatura sobre esse tópico. Por exemplo. consulte Imbens e Kolesar (2016), "Erros padrão robustos em pequenas amostras: alguns conselhos práticos".
Orientação para estudos adicionais:
Se for um auto-estudo, a próxima coisa prática a considerar são os erros padrão em cluster. Isso corrige a correlação arbitrária dentro dos clusters.
Bem, a resposta curta é basicamente o seu modelo está errado, ou seja
Portanto, no caso de heterocedasticidade, ocorrem problemas com a estimativa da matriz de variância-covariância, que levam a erros padrão errados dos coeficientes, o que, por sua vez, leva a estatísticas t e valores p errados. Resumidamente, se os termos de erro não tiverem variação constante, os mínimos quadrados comuns não serão a maneira mais eficiente de estimar. Dê uma olhada nesta questão relacionada.
fonte
A "heterocedasticidade" dificulta a estimativa do verdadeiro desvio padrão dos erros de previsão. Isso pode levar a intervalos de confiança muito grandes ou muito estreitos (em particular, serão muito estreitos para previsões fora da amostra, se a variação dos erros aumentar com o tempo).
Além disso, o modelo de regressão pode se concentrar muito em um subconjunto de dados.
Boa referência: Testando suposições de regressão linear
fonte