Esta é uma grande pergunta.
Sabemos que modelos como logística, Poisson etc. se enquadram nos modelos lineares generalizados.
Bem, sim e não. Dado o contexto da questão, devemos ter bastante cuidado para especificar do que estamos falando - e apenas "logística" e "Poisson" são insuficientes para descrever o que se pretende.
(i) "Poisson" é uma distribuição. Como descrição de uma distribuição condicional, ela não é linear (e, portanto, não é um GLM), a menos que você especifique um modelo linear (em parâmetros) para descrever a média condicional (ou seja, não é suficiente apenas dizer "Poisson"). Quando as pessoas especificar "regressão de Poisson", eles quase sempre a intenção de um modelo que é linear nos parâmetros, e é, portanto, um GLM. Mas "Poisson" por si só pode ser uma quantidade de coisas *.
(ii) "Logística", por outro lado, refere-se à descrição de uma média (que a média é logística em preditores). Não é um GLM, a menos que você o combine com uma distribuição condicional que esteja na família exponencial. Quando as pessoas dizem " regressão logística ", por outro lado, quase sempre significam um modelo binomial com link de logit - que significa logístico em preditores, o modelo é linear em parâmetros e está na família exponencial, assim como um GLM.
O modelo inclui funções não lineares dos parâmetros,
Bem, novamente, sim e não.
O linear no "modelo linear generalizado" diz que os parâmetros entram no modelo linearmente. Especificamente, o que se quer dizer é que, na escala do preditor linear , o modelo tem a forma .η= g( μ )η= Xβ
que por sua vez pode ser modelado usando a estrutura de modelo linear usando a função de link apropriada.
Corrigir
Gostaria de saber se você considera (ensina?) Situações como regressão logística como:
(Estou alterando a ordem da sua pergunta aqui)
Modelo linear, já que o link nos transforma na estrutura do modelo linear
É convencional chamar um GLM de "linear", exatamente por esse motivo. De fato, é bem claro que essa é a convenção, porque está bem ali no nome .
Modelo não linear, dada a forma dos parâmetros
Devemos ter muito cuidado aqui, porque "não linear" geralmente se refere a um modelo que não é linear em parâmetros. Contraste de regressão não linear com modelos lineares generalizados.
Portanto, se você deseja usar o termo "não linear" para descrever um GLM, é importante especificar cuidadosamente o que você quer dizer - geralmente, que a média não está linearmente relacionada aos preditores.
De fato, se você usar "não linear" para se referir aos GLMs, terá dificuldades não apenas com a convenção (e, portanto, provavelmente será mal compreendido), mas também ao tentar falar sobre modelos não lineares generalizados . É um pouco difícil de explicar a distinção se você já caracterizou os GLMs como "modelos não lineares"!
* Considere um modelo de regressão não-linear de Poisson , onde não há para o qual os parâmetros entram linearmente, portanto ainda temos:g(μ )
Y∼ Poisson ( μx)
mas, por exemplo, onde é a idade, em um dado é observado mortes e é um modelo para a mortalidade anual da população na idade :xYxμxx
μx= α + exp( βx ).
(Normalmente, teríamos um deslocamento aqui para a população na idade que mudaria o termo , mas podemos postular uma situação em que observamos uma exposição constante. Observe que os modelos de Poisson e binomial são usados para modelar a mortalidade.)xα
Aqui, o primeiro termo representa uma taxa de mortalidade constante devido a (digamos) acidentes (ou outros efeitos pouco relacionados à idade), enquanto o segundo termo tem uma taxa de mortalidade crescente devido à idade. Talvez esse modelo às vezes seja viável em curtas faixas de idades posteriores de adultos, mas não senescentes; é essencialmente a lei de Makeham (apresentada como uma função de risco, mas para a qual uma taxa anualizada seria uma aproximação razoável).
Esse é um modelo não linear generalizado.