Eu tenho uma regressão linear que é muito boa, eu acho (é para um projeto universitário, então eu realmente não preciso ser super preciso).
A questão é que, se eu traçar os resíduos versus os valores previstos, há (de acordo com meu professor) uma dica de heterocedasticidade.
Mas se eu traçar o QQ-Plot dos resíduos, fica claro que eles são normalmente distribuídos. Além disso, o teste de Shapiro nos resíduos tem um valor- de , então acho que não há dúvida de que os resíduos são realmente distribuídos normalmente.
Pergunta: Como pode haver heterocedasticidade nos valores previstos, se os resíduos são normalmente distribuídos?
ncvTest
função do pacote veicular paraR
realizar um teste formal de heterocedasticidade. No exemplo do whuber, o comandoncvTest(fit)
gera um valor-Respostas:
Uma maneira de abordar essa questão é analisá-la ao contrário: como poderíamos começar com resíduos normalmente distribuídos e organizá-los para serem heterocedásticos? Desse ponto de vista, a resposta se torna óbvia: associe os resíduos menores aos menores valores previstos.
Para ilustrar, aqui está uma construção explícita.
Os dados à esquerda são claramente heterocedásticos em relação ao ajuste linear (mostrado em vermelho). Isso é levado para casa pelos resíduos versus a previsão do gráfico à direita. Mas - por construção - o conjunto não ordenado de resíduos está quase distribuído normalmente, como mostra o histograma no meio. (O valor p no teste de normalidade Shapiro-Wilk é 0,60, obtido com o
R
comandoshapiro.test(residuals(fit))
emitido após a execução do código abaixo.)Dados reais também podem se parecer com isso. A moral é que a heterocedasticidade caracteriza uma relação entre tamanho residual e previsões, enquanto a normalidade não nos diz nada sobre como os resíduos se relacionam com qualquer outra coisa.
Aqui está o
R
código para esta construção.fonte
Na regressão de mínimos quadrados ponderados (WLS), são os fatores aleatórios dos resíduos estimados que você pode querer ver serem normalmente distribuídos, embora muitas vezes não sejam muito importantes. Os resíduos estimados podem ser fatorados, conforme mostrado em um caso de regressão simples (um regressor e por meio da origem), na parte inferior da página 1, e na metade inferior das páginas 2 e 7 em https://www.researchgate.net/publication / 263036348_Properties_of_Weighted_Least_Squares_Regression_for_Cutoff_Sampling_in_Establishment_Surveys De qualquer forma, isso pode ajudar a mostrar onde a normalidade pode aparecer na imagem.
fonte