A página da Wikipedia sobre R2 diz que pode assumir um valor maior que 1. Eu não vejo como isso é possível.
Valores de fora do intervalo de 0 a 1 pode ocorrer, onde ele é usado para medir a concordância entre os valores observados e modeladas e em que os valores "modelados" não são obtidos por regressão linear e dependendo de qual formulação de R 2 é usada. Se a primeira fórmula acima for usada, os valores poderão ser menores que zero. Se a segunda expressão for usada, os valores poderão ser maiores que um.
Essa citação se refere à "segunda expressão", mas não vejo uma segunda expressão na página.
Existe algum cenário em que pode ser maior do que 1? Estou pensando nesta questão para regressão não linear, mas gostaria de obter uma resposta geral.
[Para alguém que está vendo esta página com a pergunta oposta em mente: Sim; pode ser negativo. Isso acontece quando você ajusta um modelo que ajusta os dados pior que uma linha horizontal. Isso geralmente ocorre devido a um erro na seleção de um modelo ou restrições.]
fonte
Respostas:
Eu encontrei a resposta, então postarei a resposta na minha pergunta. Como Martijn apontou, com regressão linear você pode calcular por duas expressões equivalentes:R2
Com a regressão não linear, você não pode somar a soma dos quadrados dos resíduos e a soma dos quadrados da regressão para obter a soma total dos quadrados. Essa equação simplesmente não é verdadeira. Portanto, a equação acima não está correta. Estas duas experessions calcular dois valores diferentes para .R2
A única equação que faz sentido e é (eu acho) usada universalmente é:
Seu valor nunca é maior que 1,0, mas pode ser negativo quando você ajusta o modelo errado (ou restrições erradas), portanto, (soma dos quadrados dos resíduos) é maior que S S t (soma dos quadrados do diferença entre os valores Y reais e médios).SSe SSt
A outra equação não é usada com regressão não linear:
fonte
fonte