Especificamente, quero saber se há uma diferença entre lm(y ~ x1 + x2)
e glm(y ~ x1 + x2, family=gaussian)
. Penso que este caso particular de glm é igual a lm. Estou errado?
r
normal-distribution
generalized-linear-model
lm
user3682457
fonte
fonte
Respostas:
Enquanto para a forma específica de modelo mencionada no corpo da pergunta (ou seja,
lm(y ~ x1 + x2)
vsglm(y ~ x1 + x2, family=gaussian)
), regressão e GLMs são o mesmo modelo, a pergunta do título faz algo um pouco mais geral:Para o qual a resposta é "Sim!".
A razão pela qual eles podem ser diferentes é porque você também pode especificar uma função de link no GLM. Isso permite que você ajuste formas particulares de relacionamento não linear entre (ou melhor, sua média condicional) e as variáveis ; Embora você possa fazer isso também, não há necessidade de iniciar valores, às vezes a convergência é melhor (também a sintaxe é um pouco mais fácil).y x
nls
Compare, por exemplo, esses modelos (você tem R, então eu presumo que você possa executá-los):
Observe que o primeiro par é o mesmo modelo ( ) e o segundo par é o mesmo modelo ( e os ajustes são essencialmente os mesmos em cada par.yi∼N(β0+β1x1i+β2x2i,σ2) yi∼N(exp(β0+β1x1i+β2x2i),σ2)
Portanto - em relação à questão do título - você pode ajustar uma variedade substancialmente mais ampla de modelos gaussianos com um GLM do que com regressão.
fonte
MASS::rlm
Resposta curta, eles são exatamente os mesmos:
Resposta mais longa; A função glm se ajusta ao modelo pelo MLE, no entanto, devido à suposição que você fez sobre a função de link (neste caso, normal), você acaba com as estimativas do OLS.
fonte
glm
églm(y ~ x1 + x2, family = gaussian(link = "identity"))
.Na resposta de @ Repmat, o resumo do modelo é o mesmo, mas os ICs dos coeficientes de regressão de
confint
são ligeiramente diferentes entrelm
eglm
.lm
enquanto a distribuição normal é usada naglm
construção dos intervalos.fonte