Modelo linear não linear versus generalizado: como você se refere à regressão logística, de Poisson etc.?

23

Eu tenho uma pergunta sobre semântica na qual gostaria que as opiniões de colegas estatísticos.

Sabemos que modelos como logística, Poisson etc. se enquadram nos modelos lineares generalizados. O modelo inclui funções não lineares dos parâmetros, que por sua vez podem ser modelados usando a estrutura do modelo linear, usando a função de link apropriada.

Gostaria de saber se você considera (ensina?) Situações como regressão logística como:

  1. Modelo não linear, dada a forma dos parâmetros
  2. Modelo linear, já que o link nos transforma na estrutura do modelo linear
  3. Simultaneamente (1) e (2): "começa" como um modelo não-linear, mas pode ser trabalhado de tal maneira que nos permita pensar nele como um modelo linear

Gostaria de poder configurar uma enquete real ...

Meg
fonte

Respostas:

24

Esta é uma grande pergunta.

Sabemos que modelos como logística, Poisson etc. se enquadram nos modelos lineares generalizados.

Bem, sim e não. Dado o contexto da questão, devemos ter bastante cuidado para especificar do que estamos falando - e apenas "logística" e "Poisson" são insuficientes para descrever o que se pretende.

(i) "Poisson" é uma distribuição. Como descrição de uma distribuição condicional, ela não é linear (e, portanto, não é um GLM), a menos que você especifique um modelo linear (em parâmetros) para descrever a média condicional (ou seja, não é suficiente apenas dizer "Poisson"). Quando as pessoas especificar "regressão de Poisson", eles quase sempre a intenção de um modelo que é linear nos parâmetros, e é, portanto, um GLM. Mas "Poisson" por si só pode ser uma quantidade de coisas *.

(ii) "Logística", por outro lado, refere-se à descrição de uma média (que a média é logística em preditores). Não é um GLM, a menos que você o combine com uma distribuição condicional que esteja na família exponencial. Quando as pessoas dizem " regressão logística ", por outro lado, quase sempre significam um modelo binomial com link de logit - que significa logístico em preditores, o modelo é linear em parâmetros e está na família exponencial, assim como um GLM.

O modelo inclui funções não lineares dos parâmetros,

Bem, novamente, sim e não.

O linear no "modelo linear generalizado" diz que os parâmetros entram no modelo linearmente. Especificamente, o que se quer dizer é que, na escala do preditor linear , o modelo tem a forma .η=g(μ)η=Xβ

que por sua vez pode ser modelado usando a estrutura de modelo linear usando a função de link apropriada.

Corrigir

Gostaria de saber se você considera (ensina?) Situações como regressão logística como:

(Estou alterando a ordem da sua pergunta aqui)

Modelo linear, já que o link nos transforma na estrutura do modelo linear

É convencional chamar um GLM de "linear", exatamente por esse motivo. De fato, é bem claro que essa é a convenção, porque está bem ali no nome .

Modelo não linear, dada a forma dos parâmetros

Devemos ter muito cuidado aqui, porque "não linear" geralmente se refere a um modelo que não é linear em parâmetros. Contraste de regressão não linear com modelos lineares generalizados.

Portanto, se você deseja usar o termo "não linear" para descrever um GLM, é importante especificar cuidadosamente o que você quer dizer - geralmente, que a média não está linearmente relacionada aos preditores.

De fato, se você usar "não linear" para se referir aos GLMs, terá dificuldades não apenas com a convenção (e, portanto, provavelmente será mal compreendido), mas também ao tentar falar sobre modelos não lineares generalizados . É um pouco difícil de explicar a distinção se você já caracterizou os GLMs como "modelos não lineares"!

* Considere um modelo de regressão não-linear de Poisson , onde não há para o qual os parâmetros entram linearmente, portanto ainda temos:g(μ)

YPoisson(μx)

mas, por exemplo, onde é a idade, em um dado é observado mortes e é um modelo para a mortalidade anual da população na idade :xYxμxx

μx=α+exp(βx).

(Normalmente, teríamos um deslocamento aqui para a população na idade que mudaria o termo , mas podemos postular uma situação em que observamos uma exposição constante. Observe que os modelos de Poisson e binomial são usados ​​para modelar a mortalidade.)xα

Aqui, o primeiro termo representa uma taxa de mortalidade constante devido a (digamos) acidentes (ou outros efeitos pouco relacionados à idade), enquanto o segundo termo tem uma taxa de mortalidade crescente devido à idade. Talvez esse modelo às vezes seja viável em curtas faixas de idades posteriores de adultos, mas não senescentes; é essencialmente a lei de Makeham (apresentada como uma função de risco, mas para a qual uma taxa anualizada seria uma aproximação razoável).

Esse é um modelo não linear generalizado.

Glen_b -Reinstate Monica
fonte
Obrigado pela sua contribuição. É isso que estou tentando entender. Obviamente "linear" está no nome dos GLMs. Estou tentando classificar os modelos que são inerentemente não lineares (eles não são lineares nos parâmetros), ainda que "transformavelmente lineares" e, portanto, se enquadram na estrutura do GLM. Acho que talvez eu tenha respondido minha própria pergunta - a melhor maneira de se referir a elas é "transformavelmente não-linear".
Meg
1
A maneira mais comum de se referir a um modelo que pode ser tornado linear em parâmetros por uma transformação é "linearizável" (em contraste com "instrinicamente não linear"). Eu acho que precisamos esclarecer o que é linear (versus o que não é linear) ao discutir o modelo, e talvez também esclarecer como essas coisas são convencionalmente referidas, já que as pessoas precisam ser capazes de localizar informações e também serem entendidas ao discuti-los. Alguém que fala dos GLMs como "não-lineares" provavelmente será mal compreendido, a menos que adicione os qualificadores corretos que tornam seu significado claro.
Glen_b -Reinstala Monica
Concordo. Só o vejo classificado como regressão não linear em textos e também fui ensinado por meus professores que é não-linear. Pessoalmente, acho isso confuso, já que lidamos com isso na estrutura GLM, mas também posso (pelo menos) ter empatia por chamá-lo. Eu acho que estou indo com linearizável / transformavelmente linear e uma discussão de como chegamos do ponto A ao ponto B (isto é, como começamos com uma função não-linear e a transformamos na estrutura linear).
Meg
Sim, eu entendo totalmente. Embora eu também simpatize com o impulso deles de fazê-lo, se eu tivesse o ouvido deles, os advertiria contra a prática de chamá-los de modelos não-lineares (pelo menos não sem sempre qualificar o termo), pelas razões descritas acima. Essa é uma grande parte do motivo pelo qual eu acho que essa é uma pergunta tão importante - às vezes as pessoas as chamam de não lineares, o que eu acho que é bom desde que tenhamos certeza sobre o que estamos chamando de não linear, já que não é a maneira mais convencional de consulte os modelos - quando desafiamos as convenções, devemos fazê-lo com cuidado e deliberadamente.
Glen_b -Reinstala Monica