Isso é muito difícil de descrever, mas tentarei tornar meu problema compreensível. Então, primeiro você precisa saber que eu fiz uma regressão linear muito simples até agora. Antes de estimar o coeficiente, observei a distribuição do meu . É pesado à esquerda inclinado. Depois que estimei o modelo, tive a certeza de observar também um resíduo inclinado à esquerda em um QQ-Plot, mas absolutamente não o fiz. Qual pode ser o motivo dessa solução? Onde está o erro? Ou tem a distribuição nada a ver com a distribuição do termo de erro?y
regression
residuals
skewness
MarkDollar
fonte
fonte
Respostas:
Para responder sua pergunta, vamos dar um exemplo muito simples. O modelo de regressão simples é dado por , onde . Agora, suponha que seja dicotômico. Se não for igual a zero, a distribuição de não será normal, mas na verdade uma mistura de duas distribuições normais, uma com média e outra com média .ϵ i ∼ N ( 0 , σ 2 ) x i β 1 y i β 0 β 0 + β 1yi=β0+β1xi+ϵi ϵi∼N(0,σ2) xi β1 yi β0 β0+β1
Se for grande o suficiente e for pequeno o suficiente, um histograma de parecerá bimodal. No entanto, também é possível obter um histograma de que se parece com uma distribuição enviesada "única". Aqui está um exemplo (usando R):σ 2 y i y iβ1 σ2 yi yi
Não é a distribuição de que importa - mas a distribuição dos termos de erro.yi
E isso parece perfeitamente normal - não apenas falando figurativamente =)
fonte
Com referência à excelente resposta de @Wolfgang, aqui estão os gráficos de seu código R:
fonte