Problema ao comparar modelos GLM com uma função de link diferente

12

Dado o mesmo conjunto de covariáveis ​​e família de distribuição, como posso comparar modelos com diferentes funções de link?

Acho que a resposta correta aqui é "AIC / BIC", mas não tenho 100% de certeza.

É possível ter modelos aninhados se eles tiverem um link diferente?

Davide
fonte
Observe que "AIC / BIC" é uma das respostas possíveis, mas, em princípio, qualquer técnica de seleção de modelo (apropriada) pode ser empregada.
2
Não, eles não estão aninhados. Além disso, lembre-se que quando se utiliza AIC / BIC, as constante de normalização importa também.
5
Os critérios de informação, como o AIC e o BIC, simplesmente ajustam o desvio do modelo para sua complexidade (ou seja, o número de parâmetros). Se você tiver o mesmo número de covariáveis ​​(nem mesmo necessariamente as mesmas covariáveis), esse ajuste será irrelevante. Você pode verificá-los comparando os desvios diretamente. Talvez você ache útil ler minha resposta aqui: diferença entre modelos de logit e probit , que aborda esse problema.
gung - Restabelece Monica
3
Outra possibilidade para comparar modelos, que é muito geral, mas exige mais de você, é usar o método de ajuste cruzado Parametric Bootstrap. Você pode encontrar um pdf aqui .
gung - Restabelece Monica
2
Existe uma família em particular que você tem em mente com 2 possíveis funções de link? ou seja, família binomial, logit vs link de log?
Placidia

Respostas:

9

Para esse problema, você também pode usar os chamados "testes de qualidade de link", cujo tratamento canônico foi publicado por Daryl Pregibon na Applied Statistics em 1980. Você pode ler o artigo aqui.

Também houve alguns trabalhos mais recentes nessa frente, notadamente por Cheng e Wu em seu artigo da JASA de 1994 .

Como afirmado por @gung, também é possível usar o desvio, veja, por exemplo, este documento, se você não quiser levá-lo ao valor nominal.

Momo
fonte
3
+1, é bom ter o papel canônico. BTW, suspeito que você quis dizer trabalho recente , não trabalho "racional".
gung - Restabelece Monica
6

(Estou apenas copiando as informações dos comentários aqui para que esta pergunta não apareça como oficialmente sem resposta.)

Você pode comparar os dois modelos comparando os desvios. Tudo o que a AIC e a BIC fazem é ajustar os desvios para o número de parâmetros no modelo. Como esse número é o mesmo, não fará diferença. Em geral, será muito difícil diferenciar entre diferentes funções de link, a menos que tenham uma forma diferente; geralmente é melhor usar o conhecimento teórico para determinar a função de link apropriada. Por exemplo, os links logit e probit mal diferem de forma, mas diferem na maneira como você pensa sobre o processo de geração de dados (como discutido aqui ).

Repor a Monica
fonte