Estou usando a função Deming fornecida por Terry T. neste segmento de ajuda r arquivado . Estou comparando dois métodos, então tenho dados parecidos com este:
y x stdy stdx
1 1.2 0.23 0.67
2 1.8 0.05 0.89
4 7.5 1.13 0.44
... ... ... ...
Fiz minha regressão de Deming (também chamada de "regressão total dos mínimos quadrados") e recebo uma inclinação e intercepto. Gostaria de obter um coeficiente de correlação, para começar a calcular o . Eu inseri manualmente a fórmula:
R2 <- function(coef,i,x,y,sdty){
predy <- (coef*x)+i
stdyl <- sum((y-predy)^2) ### The calculated std like if it was a lm (SSres)
Reelstdy <- sum(stdy) ### the real stdy from the data (SSres real)
disty <- sum((y-mean(y))^2) ### SS tot
R2 <- 1-(stdyl/disty) ### R2 formula
R2avecstdyconnu <- 1-(Reelstdy/disty) ### R2 with the known stdy
return(data.frame(R2, R2avecstdyconnu, stdy, Reelstdy))
}
Esta fórmula funciona e me dá saída.
- Qual dos dois s faz mais sentido? (Eu pessoalmente acho que os dois são meio tendenciosos.)
- Existe uma maneira de obter um coeficiente de correlação a partir de uma regressão total ao quadrado mínimo?
SAÍDA DA REGRESSÃO EXIGENTE:
Call:
deming(x = Data$DS, y = Data$DM, xstd = Data$SES, ystd = Data$SEM, dfbeta = T)
Coef se(coef) z p
Intercept 0.3874572 0.2249302 3.1004680 2.806415e-10
Slope 1.2546922 0.1140142 0.8450883 4.549709e-02
Scale= 0.7906686
>
r
r-squared
deming-regression
total-least-squares
Nico Coallier
fonte
fonte
Respostas:
Para elaborar a resposta do whuber's acima - a Pearson fornecerá o que você deseja. Determina quão bem y se correlaciona com x usando uma abordagem independente do modelo de regressão :
O gx.rma do pacote rgr fará o total de mínimos quadrados e calculará o Pearson para você (ou você pode continuar com Deming e fazê-lo manualmente).
Portanto, a resposta básica para sua pergunta é: ao fazer o total de mínimos quadrados, esqueça o quadrado R e use Pearson. Você sempre pode acertar isso se quiser um resultado entre 0 e 1. Isso fará tudo o que você precisa.
Dito isto, irei elaborar um pouco, pois entendo que devemos poder calcular um equivalente ao quadrado R.
Primeiro, vamos tentar uma regressão normal da soma dos quadrados nos dados usando lm. Observe que ele fornece o mesmo coeficiente de correlação de Pearson (após o enraizamento quadrado e se preocupar apenas com a magnitude, obviamente).
Isso é calculado a partir do resultado do modelo lm usando a abordagem tradicional da soma dos quadrados
Portanto, desde que você use o modelo dado por lm, (Pearson) -quared e R-squared são equivalentes.
No entanto, se você usar o modelo da regressão da soma total dos quadrados e tentar usar a última equação, obterá um resultado ligeiramente diferente. Isso é óbvio porque os mínimos quadrados normais e totais usam diferentes funções de minimização, portanto, forneça modelos com gradientes e intercepções levemente diferentes. (Lembre-se de que a primeira equação ainda dará o mesmo resultado que está observando apenas os dados.)
É aqui que eu fico desligado. Se as duas equações dão o mesmo resultado ao usar o modelo lm, certamente deve haver uma formulação equivalente para a última equação, mas ao usar o modelo de mínimos quadrados totais, o que também fornece o mesmo resultado?
Tive uma rápida experiência com diferentes abordagens, usando a função de minimização apropriada (como o cartaz aqui: Coeficiente de determinação de uma regressão ortogonal ), mas não consigo encontrar uma maneira de fazer isso - se houver uma maneira.
Talvez nós dois fiquemos preocupados com o fato de Pearson e R-quadrado darem o mesmo resultado ao usar mínimos quadrados normais - e simplesmente não há uma maneira de fazer R-quadrado no total de mínimos quadrados, o que dará o mesmo resultado como Pearson. Mas não sei o suficiente sobre isso para dizer por que não.
fonte
Usando o pacote "mcr"
e usando a função para gerar seu modelo de regressão de deming
e produzindo um gráfico usando a função
Isso exibe a correlação do momento de produção de Pearson no gráfico para o modelo, que informa a força e a direção do relacionamento linear entre suas duas variáveis x, y, mas não fornece a proporção da variação explicada.
Espero que ajude.
fonte