Ao usar o software estatístico, Ao definir seus modelos lineares, por que a interceptação é digitada como 1, em vez de "const" ou "interceptar" ou algo assim. Que significado eu tenho?
Existe alguma razão histórica? Ou isso é lógico, de alguma maneira, que estou deixando de entender? A interceptação poderia muito bem ser qualquer número.
Exemplo da biblioteca statsmodels em python:
model = smf.ols('Height ~ 1', data = height_sample_data)
Eu sei que o pacote Lmer para R é muito semelhante.
regression
software
intercept
Adam B
fonte
fonte
Respostas:
É lógico, depois de considerar a notação da matriz em que sua fórmula será traduzida internamente. Na matriz, os preditores não constantes serão traduzidos em (uma ou mais) colunas e a interceptação será traduzida em uma coluna composta inteiramente por uma.
Por exemplo, em R você escreveria um OLS muito simples como:
Na notação matricial, isso seria traduzido em um modelo
e agora você vê de onde vem o .1
Na verdade, você pode deixar de
1+
fora, pois R sempre presume que você deseja incluir uma interceptação, portanto isso é completamente equivalente aNo entanto, se você deseja suprimir a interceptação, escreva algo como
que seria traduzido em uma matriz sem uma coluna 1:
fonte