Ao realizar a regressão polinomial de para , as pessoas às vezes usam polinômios brutos, às vezes polinômios ortogonais. Mas quando eles usam o que parece completamente arbitrário.
Aqui e aqui polinômios brutos são usados. Mas aqui e aqui , polinômios ortogonais parecem dar os resultados corretos. O que, como, por quê ?!
Em contraste com isso, ao aprender sobre regressão polinomial a partir de um livro didático (por exemplo, ISLR ), isso nem sequer menciona polinômios brutos ou ortogonais - apenas o modelo a ser ajustado é fornecido.
Então, quando precisamos usar o quê?
E por que os valores de p individuais para , etc. diferem muito entre esses dois valores?
regression
polynomial
l7ll7
fonte
fonte
Respostas:
Vamos dar uma olhada com uma simulação muito simples.
Agora, com um termo quadrático no modelo para ajustar.
É claro que o teste geral ainda é significativo, mas acho que o resultado que estamos procurando não é esse. A solução é usar polinômios ortogonais.
Observe que os coeficientes de
x
no primeiro modelo e depoly(x,2)1
no segundo modelo não são iguais e até as interceptações são diferentes. Isso ocorre porquepoly
fornece vetores ortogonais, que também são ortogonais ao vetorrep(1, length(x))
. Entãopoly(x,2)1
não é,x
mas sim(x -mean(x))/sqrt(sum((x-mean(x))**2))
...fonte
Para fazer uma avaliação ingênua da situação:
Portanto, em termos de previsão, não há (neste caso) nenhuma diferença.
Do ponto de vista computacional, uma matriz modelo que consiste em funções de base ortogonal possui boas propriedades numéricas / computacionais para o estimador de mínimos quadrados. Embora, ao mesmo tempo, do ponto de vista estatístico, a ortogonalização resulte em estimativas não correlacionadas, uma vez que sob as premissas padrão.var(θ~^)=Iσ²
A questão natural surge se existe um melhor sistema de base truncada. No entanto, a resposta à pergunta não é simples nem única e depende, por exemplo, da definição da palavra "melhor", ou seja, o que você está tentando arquivar.
fonte