Esquerda inclinada vs. distribuição simétrica observada

10

Isso é muito difícil de descrever, mas tentarei tornar meu problema compreensível. Então, primeiro você precisa saber que eu fiz uma regressão linear muito simples até agora. Antes de estimar o coeficiente, observei a distribuição do meu . É pesado à esquerda inclinado. Depois que estimei o modelo, tive a certeza de observar também um resíduo inclinado à esquerda em um QQ-Plot, mas absolutamente não o fiz. Qual pode ser o motivo dessa solução? Onde está o erro? Ou tem a distribuição nada a ver com a distribuição do termo de erro?yyy

MarkDollar
fonte
O @Aniko fornece uma boa resposta em resposta à sua pergunta anterior.
whuber

Respostas:

22

Para responder sua pergunta, vamos dar um exemplo muito simples. O modelo de regressão simples é dado por , onde . Agora, suponha que seja dicotômico. Se não for igual a zero, a distribuição de não será normal, mas na verdade uma mistura de duas distribuições normais, uma com média e outra com média .ϵ iN ( 0 , σ 2 ) x i β 1 y i β 0 β 0 + β 1yi=β0+β1xi+ϵiϵiN(0,σ2)xiβ1yiβ0β0+β1

Se for grande o suficiente e for pequeno o suficiente, um histograma de parecerá bimodal. No entanto, também é possível obter um histograma de que se parece com uma distribuição enviesada "única". Aqui está um exemplo (usando R):σ 2 y i y iβ1σ2yiyi

xi <- rbinom(10000, 1, .2)
yi <- 0 + 3 * xi + rnorm(10000, .7)
hist(yi, breaks=20)
qqnorm(yi); qqline(yi)

Não é a distribuição de que importa - mas a distribuição dos termos de erro.yi

res <- lm(yi ~ xi)
hist(resid(res), breaks=20)
qqnorm(resid(res)); qqline(resid(res))

E isso parece perfeitamente normal - não apenas falando figurativamente =)

Wolfgang
fonte
"mas a distribuição dos termos de erro" Você quer dizer aqui resíduos, não termos de erro, certo? Para obter mais informações sobre resíduos versus erro: stats.stackexchange.com/questions/133389/…
vasili111
7

Com referência à excelente resposta de @Wolfgang, aqui estão os gráficos de seu código R:

insira a descrição da imagem aqui

Contango
fonte