Splines em GLM e GAM

12

É errado que os splines estejam disponíveis apenas nos modelos GAM, e não nos modelos GLM? Ouvi isso um tempo atrás, e me pergunto se isso é apenas um equívoco ou se tem alguma verdade. Aqui está uma ilustração: http://www.stats.uwo.ca/faculty/bellhouse/glm%20and%20gam.pdf

HeyJane
fonte

Respostas:

18

E[Y|X]=β0+β1X+β2X2X

O spline pode ser simplesmente visto como uma parametrização sofisticada de uma ou mais covariáveis ​​de valor contínuo ou pseudo-contínuo.

AdamO
fonte
Obrigado por responder! Então, ao dizer que estou enganado, você quer dizer que splines podem ser usadas no GLM, correto? Não entendi completamente.
HeyJane
Sim absolutamente. Em R, importe o pacote splinese a execução bs(...)permite criar uma representação linear de um spline com um grau polinomial especificado pelo usuário e pontos de nó.
Adamo
7
Escrevi muito sobre essa questão aqui: madrury.github.io/jekyll/update/statistics/2017/08/04/…
Matthew Drury
Muito obrigado a vocês dois! Eu vejo agora, AdamO! Ótima página, Matthew, vou ler tudo! :)
HeyJane 19/08
12

A resposta do @ AdamO está correta, pois os ajustes baseados em splines certamente podem ser feitos na estrutura GLM padrão. Isso não quer dizer que os GAMs sejam apenas um caso especial dos GLMs! Embora haja uma série de modelos exatamente idênticos e que podem ser enquadrados como GAM ou GLM com uma expansão spline das covariáveis, existem alguns modelos GAM que não estão disponíveis na estrutura GLM padrão.

Por exemplo, pode-se ajustar um modelo GAM usando um spline de suavização para cada uma das covariáveis. Isso basicamente resulta em uma expansão spline das variáveis, mas com uma penalidade nas segundas derivadas. Isso resulta em um modelo que está um pouco fora da estrutura padrão do GLM.

Além disso, é geralmente considerado um procedimento padrão e é incorporado à maioria das bibliotecas GAM, para ajustar parâmetros de suavização (por exemplo, graus de liberdade de spline etc.) otimizando várias medidas de erros fora da amostra, enquanto a formulação GLM normalmente considera o espaço covariado fixo.

Cliff AB
fonte
Eu gostaria de poder te votar, mas não tenho pontos suficientes. Obrigado por contribuir. Não sei se entendi seu segundo parágrafo: você está dizendo que splines de suavização só podem ser compatíveis com o GAM? Você poderia elaborar qual é exatamente a diferença entre um spline cúbico regular e um spline cúbico de suavização? Eu entendo que isso é pedir muito.
precisa saber é o seguinte
@ HeyJane: se você olhar a página da wikipedia, notará que esses splines são penalizados por sua segunda derivada. Isso permite controlar a suavidade por uma penalidade contínua, e não por graus inteiros de liberdade. Como tal, é um problema de máxima verossimilhança penalizado, em vez de um problema de verossimilhança máxima padrão. Isso significa que você não pode ajustá-los diretamente com a glmfunção R , ao contrário do uso de splines cúbicos padrão com um glm.
Cliff AB
2
Aha! Entendi! Então, em vez de, com um spline cúbico regular, dizer que queremos apenas que as segundas derivadas sejam iguais aos nós, queremos impor alguma propriedade à segunda derivada, ou seja, a segunda derivada não é alta, daí o termo da penalidade?
HeyJane
@ HeyJane: sim, eu diria que é um bom resumo.
Cliff AB