Existe alguma razão para não usar polinômios ortogonais ao ajustar regressões?

13

Em geral, estou me perguntando se é sempre melhor não usar polinômios ortogonais ao ajustar uma regressão com variáveis ​​de ordem superior. Em particular, eu estou pensando com o uso de R:

Se poly()com raw = FALSEproduz os mesmos valores ajustados como poly()com raw = TRUE, e polycom raw = FALSEresolve alguns dos problemas associados com regressões polinomiais, então deve poly()com raw = FALSE sempre ser utilizado para a montagem de regressões polinomiais? Em que circunstâncias seria melhor não usar poly()?

user2374133
fonte

Respostas:

16

Sempre uma razão? Certo; provavelmente vários.

Considere, por exemplo, onde estou interessado nos valores dos coeficientes brutos (digamos, compará-los com valores hipotéticos), e a colinearidade não é um problema específico. É praticamente a mesma razão pela qual muitas vezes não me refiro ao centro da regressão linear comum (que é o polinômio ortogonal linear)

Não são coisas com as quais você não possa lidar por meio de polinômios ortogonais; é mais uma questão de conveniência, mas a conveniência é uma grande razão pela qual eu faço muitas coisas.

Dito isto, eu me inclino para polinômios ortogonais em muitos casos enquanto ajusto polinômios, pois eles têm alguns benefícios distintos.

Glen_b -Reinstate Monica
fonte
é possível comparar os coeficientes resultantes de uma regressão polinomial ortogonal a valores hipotéticos?
user2374133
2
Sim. Você pode transformá-los de volta aos coeficientes implícitos e erros padrão dos polinômios "brutos", por exemplo.
Glen_b -Reinstala Monica
2
Frequentemente, a conversão da base polinomial ortogonal para a base monomial é um processo mal condicionado (para altos graus; a conversão em baixo grau não é muito ruim); portanto, se alguém está interessado a priori nos coeficientes da base monomial, qualquer a estabilidade numérica que você obteve ao usar os polinômios ortogonais é lançada pela janela na conversão; portanto, você também pode usar monômios desde o início. Advertência emptor , é claro.
JM não é estatístico
1
@JM Obrigado, esse é um ponto excelente. Felizmente, hoje em dia, seria muito raro em aplicações estatísticas caber mais do que um polinômio de ordem razoavelmente baixa (meu conselho habitual é que, a menos que haja uma forte razão teórica para ultrapassar o grau três ou quatro, deve-se considerar diferentes abordagens - qual alternativa pode ser melhor depende das circunstâncias, mas coisas como splines, por exemplo, podem ser adequadas para algumas situações.).
Glen_b -Replica Monica
13

Como se o seu modelo sair de R quando crescer, lembre-se de compactar suas constantes de centralização e normalização e precisará arrastá-las o tempo todo. Imagine se deparar com isso um dia codificado em SQL e o horror de perceber que os perdeu!

Scortchi - Restabelecer Monica
fonte