Meu entendimento é que não pode ser negativo, pois é o quadrado de R. No entanto, executei uma regressão linear simples no SPSS com uma única variável independente e uma variável dependente. Minha saída do SPSS me fornece um valor negativo para . Se eu fosse calcular isso manualmente a partir de R, então seria positivo. O que o SPSS fez para calcular isso como negativo?
R=-.395
R squared =-.156
B (un-standardized)=-1261.611
Código que eu usei:
DATASET ACTIVATE DataSet1.
REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10) /NOORIGIN
/DEPENDENT valueP /METHOD=ENTER ageP
Eu recebo um valor negativo. Alguém pode explicar o que isso significa?
regression
spss
r-squared
Anne
fonte
fonte
Respostas:
Exemplo: ajuste os dados a um modelo de regressão linear restrito para que a interceptação em seja igual a .Y 1500
O modelo não faz nenhum sentido, dados esses dados. É claramente o modelo errado, talvez escolhido por acidente.
O ajuste do modelo (uma linha reta restrita a passar pelo ponto (0,1500)) é pior que o ajuste de uma linha horizontal. Portanto, a soma dos quadrados do modelo é maior que a soma dos quadrados da linha horizontal . é calculado como . Quando é maior que , essa equação calcula um valor negativo para .(SSreg) (SStot) R2 1−SSregSStot SSreg SStot R2
Com regressão linear sem restrições, deve ser positivo (ou zero) e igual ao quadrado do coeficiente de correlação, . Um negativo só é possível com regressão linear quando a interceptação ou a inclinação são restringidas, de modo que a linha de "melhor ajuste" (dada a restrição) se encaixe pior que uma linha horizontal. Com a regressão não linear, o pode ser negativo sempre que o modelo de melhor ajuste (dada a equação escolhida e suas restrições, se houver) se ajusta aos dados pior que uma linha horizontal.R2 r R2 R2
Conclusão: um negativo não é uma impossibilidade matemática ou o sinal de um bug do computador. Significa simplesmente que o modelo escolhido (com suas restrições) se ajusta muito mal aos dados.R2
fonte
Você esqueceu de incluir um intercepto em sua regressão? Não estou familiarizado com o código SPSS, mas na página 21 da Econometria de Hayashi:
Eu verificaria e garantiria que o SPSS esteja incluindo uma interceptação em sua regressão.
fonte
NOORIGIN
isso significaria que a interceptação não foi incluída no modelo, apenas excluindo o nome.Isso pode acontecer se você tiver uma série temporal que é Niid e construir um modelo ARIMA inadequado da forma (0,1,0), que é um modelo de caminhada aleatória de primeira diferença sem desvio, e a variação (soma dos quadrados - SSE) dos resíduos será maior que a variação (soma dos quadrados SSO) da série original. Assim, a equação 1-SSE / SSO produzirá um número negativo à medida que o SSE executa o SSO. Vimos isso quando os usuários simplesmente ajustam um modelo assumido ou usam procedimentos inadequados para identificar / formar uma estrutura ARIMA apropriada. A mensagem maior é que um modelo pode distorcer (muito parecido com um par de óculos ruins) sua visão. Sem ter acesso aos seus dados, eu teria um problema ao explicar seus resultados defeituosos. Você trouxe isso à atenção da IBM?
A ideia de um modelo assumido como contraproducente foi ecoada por Harvey Motulsky. Ótimo post Harvey!
fonte