Eu realmente não entendo heterocedasticidade. Gostaria de saber se meu modelo é apropriado ou não, de acordo com esse gráfico.
r
regression
residuals
heteroscedasticity
independence
Kanbhold
fonte
fonte
Respostas:
Como o @IrishStat comentou, você precisa verificar os valores observados em relação aos erros para ver se há problemas com a variabilidade. Voltarei a isso no final.
tão certo, como meu modelo se comporta:
o que deve fornecer algo assim: o que significa que seus resíduos não parecem ter uma tendência óbvia com base no seu índice arbitrário (1º lote - menos informativo realmente), parecem não ter uma correlação real entre eles (2º lote - bastante importante e provavelmente mais importante que a homosquasticidade) e que os valores ajustados não têm uma tendência óbvia de falha, ie. seus valores ajustados versus seus resíduos parecem bastante aleatórios. Com base nisso, diríamos que não temos problemas de heterocedasticidade, pois nossos resíduos parecem ter a mesma variação em todos os lugares.
OK, você deseja heterocedasticidade. Dadas as mesmas suposições de linearidade e aditividade, vamos definir outro modelo generativo com problemas "óbvios" de heterocedasticidade. Ou seja, após alguns valores, nossa observação será muito mais barulhenta.
onde as plotagens simples de diagnóstico do modelo:
deve dar algo como: Aqui, o primeiro enredo parece um pouco "estranho"; parece que temos alguns resíduos que se agrupam em pequenas magnitudes, mas isso nem sempre é um problema ... O segundo gráfico é bom, significa que não temos correlação entre os resíduos em diferentes atrasos, para que possamos respirar por um momento. E o terceiro lote derrama o feijão: é óbvio que, quando chegamos a valores mais altos, nossos resíduos explodem. Definitivamente, temos heterocedasticidade nos resíduos deste modelo e precisamos fazer algo a respeito (por exemplo , IRLS , regressão de Theil – Sen , etc.)
Aqui o problema era realmente óbvio, mas em outros casos, podemos ter perdido; para reduzir nossas chances de perdê-lo, outro enredo perspicaz foi o mencionado por IrishStat: Residuals versus Observed values, ou para o nosso problema de brinquedo em questão:
que deve dar algo como:
Para ser justo, sua plotagem de resíduos versus valores ajustados parece relativamente boa. Verificar seus resíduos versus os valores observados provavelmente seria útil para garantir que você esteja do lado seguro. (Eu não mencionei gráficos de QQ ou algo parecido para não confundir mais as coisas, mas você também pode querer checar brevemente.) Espero que isso ajude no seu entendimento da heterocedasticidade e no que você deve procurar.
fonte
Sua pergunta parece ser sobre heterocedasticidade (porque você a mencionou por nome e adicionou a tag), mas sua pergunta explícita (por exemplo, no título e) que encerra sua postagem é mais geral ", se meu modelo é apropriado ou não, de acordo com isso enredo". Há mais para determinar se um modelo é inadequado do que avaliar a heterocedasticidade.
Raspei seus dados usando este site (ht @Alexis). Observe que os dados são classificados em ordem crescente de
fitted
. Com base na regressão e no gráfico superior esquerdo, parece ser suficientemente fiel:Não vejo nenhuma evidência de heterocedasticidade aqui. Do canto superior direito (gráfico qq), também não parece haver problemas com a suposição de normalidade.
Por outro lado, a curva "S" no ajuste do lowess vermelho (na plotagem superior esquerda) e as plotagens acf e pacf (na parte inferior) parecem problemáticas. No extremo esquerdo, a maioria dos resíduos está acima da linha 0 cinza. À medida que você se move para a direita, a maior parte dos resíduos cai abaixo de 0, depois acima e depois abaixo novamente. O resultado disso é que, se eu lhe dissesse que estava olhando para um determinado resíduo e que tivesse um valor negativo (mas não lhe disse qual eu estava olhando), você poderia adivinhar com precisão que os resíduos próximos também foram negativamente valorizados. Em outras palavras, os resíduos não são independentes - saber algo sobre um fornece informações sobre outros.
Além das parcelas, isso pode ser testado. Uma abordagem simples é usar um teste de execução :
Para responder às suas perguntas explícitas: Seu gráfico mostra autocorrelações em série / não independência de seus resíduos. Isso significa que seu modelo não é apropriado em sua forma atual.
fonte