Como o modelo linear generalizado generaliza o modelo linear geral?

8

Da Wikipedia

O modelo linear geral (GLM) é um modelo linear estatístico. Pode ser escrito como 1

Y=XB+U,
onde Y é uma matriz com uma série de medidas multivariadas, X é uma matriz que pode ser uma matriz de design, B é uma matriz contendo parâmetros que geralmente devem ser estimados e U é uma matriz contendo erros ou ruído. Geralmente, supõe-se que os erros sigam uma distribuição normal multivariada.

Diz então

Se os erros não seguem uma distribuição normal multivariada, modelos lineares generalizados podem ser usadas para relaxar suposições sobre Y e U .

Eu queria saber como os modelos lineares generalizados relaxam suposições sobre Y e U nos modelos lineares gerais?

Note que eu posso entender a outra relação deles na direção oposta:

O modelo linear geral pode ser visto como um caso do modelo linear generalizado com link de identidade.

Mas duvido que isso ajude com minha pergunta.

Tim
fonte

Respostas:

10

10

y^iμiX=xiπ^iXβproduzirá valores previstos de (ou seja, ) que serão ou . Mas isso é impossível, porque o intervalo de é . Portanto, precisamos transformar o parâmetro para que ele possa variar , assim como o lado direito do seu GLiM. Portanto, você precisa de uma função de link . y^iπ^i<0>1π(0, 1)π(, )

Neste ponto, estipulamos uma distribuição de resposta (Bernoulli) e uma função de link (talvez a transformação do logit ). Já temos uma parte estrutural do nosso modelo: . Então agora temos todas as partes necessárias do nosso modelo. Este é agora o modelo linear generalizado, porque relaxamos as suposições sobre nossa variável de resposta e os erros. Xβ

Para responder suas perguntas específicas mais diretamente, o modelo linear generalizado relaxa as suposições sobre e , colocando uma distribuição de resposta (na família exponencial ) e uma função de link que mapeia o parâmetro em questão para o intervalo . YU(, )

Para mais informações sobre este tópico, pode ser útil ler minha resposta a esta pergunta: Diferença entre os modelos logit e probit .

- Reinstate Monica
fonte
(+1) Resposta concisa e compreensível.
COOLSerdash
Obrigado gung! Em modelos lineares gerais, "geralmente se supõe que os erros sigam uma distribuição normal multivariada". É correto que os modelos lineares gerais não sejam necessariamente paramétricos no sentido de que eles não especificam completamente a forma da distribuição de Y dado X? Como um modelo linear generalizado sempre especifica a distribuição de Y dado X como uma distribuição familiar exponencial, é correto que um modelo linear geral não seja um modelo linear generalizado?
Tim
Não, o modelo linear geral é totalmente especificado; é sempre um caso especial do modelo linear generalizado.
gung - Restabelece Monica
"Geralmente, considera-se que" os erros seguem uma distribuição normal multivariada "no WIkipedia para o modelo linear geral significa que o erro pode não ser normalmente distribuído?
Tim