É possível calcular o quadrado R em uma regressão total de mínimos quadrados?

8

Estou usando a função Deming fornecida por Terry T. neste segmento de ajuda r arquivado . Estou comparando dois métodos, então tenho dados parecidos com este:

y  x     stdy   stdx
1  1.2   0.23   0.67
2  1.8   0.05   0.89
4  7.5   1.13   0.44
... ...  ...   ...

Fiz minha regressão de Deming (também chamada de "regressão total dos mínimos quadrados") e recebo uma inclinação e intercepto. Gostaria de obter um coeficiente de correlação, para começar a calcular o . Eu inseri manualmente a fórmula:R2

R2 <- function(coef,i,x,y,sdty){
    predy    <- (coef*x)+i
    stdyl    <- sum((y-predy)^2)   ### The calculated std like if it was a lm (SSres)
    Reelstdy <- sum(stdy)          ### the real stdy from the data  (SSres real)
    disty    <- sum((y-mean(y))^2) ### SS tot
    R2       <- 1-(stdyl/disty)    ### R2 formula
    R2avecstdyconnu <- 1-(Reelstdy/disty) ### R2 with the known stdy
    return(data.frame(R2, R2avecstdyconnu, stdy, Reelstdy))
}

Esta fórmula funciona e me dá saída.

  • Qual dos dois s faz mais sentido? (Eu pessoalmente acho que os dois são meio tendenciosos.) R2
  • Existe uma maneira de obter um coeficiente de correlação a partir de uma regressão total ao quadrado mínimo?

SAÍDA DA REGRESSÃO EXIGENTE:

Call:
deming(x = Data$DS, y = Data$DM, xstd = Data$SES, ystd = Data$SEM,     dfbeta = T)

               Coef  se(coef)         z            p
Intercept 0.3874572 0.2249302 3.1004680 2.806415e-10
Slope     1.2546922 0.1140142 0.8450883 4.549709e-02

   Scale= 0.7906686 
> 
Nico Coallier
fonte
2
Como um coeficiente de correlação pode ser calculado sem nenhuma referência à regressão, você poderia esclarecer o que quer dizer com "coeficiente de correlação"? Eu estou tentando descobrir se a Pearson vai responder a sua pergunta ou se você está talvez à procura de algum tipo de "coeficiente de determinação" para servir como um análogo para os mínimos quadrados . Se for o último, o que você espera que esse analógico lhe diga? R 2ρR2
whuber
Estou tentando ver quão bem y se correlaciona com x. Adicionei minha saída à pergunta da regressão deming (regressão total ao quadrado mínimo). Quero poder dizer que o método dois fornece resultados semelhantes em outras palavras.
Nico Coallier

Respostas:

6

Para elaborar a resposta do whuber's acima - a Pearson fornecerá o que você deseja. Determina quão bem y se correlaciona com x usando uma abordagem independente do modelo de regressão :

ρX,Y=cov(X,Y)σXσY

O gx.rma do pacote rgr fará o total de mínimos quadrados e calculará o Pearson para você (ou você pode continuar com Deming e fazê-lo manualmente).

require(rgr)
set.seed(3)
x<-rnorm(101,mean=2.3,sd=4.2)
x<-x+seq(0,100) 
set.seed(3)
y<-rnorm(101,mean=4.9,sd=1.9)
y<-y+seq(6,206,length=101)

rma<-gx.rma(x,y)
rma$corr
[1] 0.9922014

Portanto, a resposta básica para sua pergunta é: ao fazer o total de mínimos quadrados, esqueça o quadrado R e use Pearson. Você sempre pode acertar isso se quiser um resultado entre 0 e 1. Isso fará tudo o que você precisa.

Dito isto, irei elaborar um pouco, pois entendo que devemos poder calcular um equivalente ao quadrado R.

Primeiro, vamos tentar uma regressão normal da soma dos quadrados nos dados usando lm. Observe que ele fornece o mesmo coeficiente de correlação de Pearson (após o enraizamento quadrado e se preocupar apenas com a magnitude, obviamente).

ols<-lm(y~x)
sqrt(summary(ols)$r.squared)
[1] 0.9922014

Isso é calculado a partir do resultado do modelo lm usando a abordagem tradicional da soma dos quadrados

R2=1SresStot

Portanto, desde que você use o modelo dado por lm, (Pearson) -quared e R-squared são equivalentes.

No entanto, se você usar o modelo da regressão da soma total dos quadrados e tentar usar a última equação, obterá um resultado ligeiramente diferente. Isso é óbvio porque os mínimos quadrados normais e totais usam diferentes funções de minimização, portanto, forneça modelos com gradientes e intercepções levemente diferentes. (Lembre-se de que a primeira equação ainda dará o mesmo resultado que está observando apenas os dados.)

É aqui que eu fico desligado. Se as duas equações dão o mesmo resultado ao usar o modelo lm, certamente deve haver uma formulação equivalente para a última equação, mas ao usar o modelo de mínimos quadrados totais, o que também fornece o mesmo resultado?

Tive uma rápida experiência com diferentes abordagens, usando a função de minimização apropriada (como o cartaz aqui: Coeficiente de determinação de uma regressão ortogonal ), mas não consigo encontrar uma maneira de fazer isso - se houver uma maneira.

Talvez nós dois fiquemos preocupados com o fato de Pearson e R-quadrado darem o mesmo resultado ao usar mínimos quadrados normais - e simplesmente não há uma maneira de fazer R-quadrado no total de mínimos quadrados, o que dará o mesmo resultado como Pearson. Mas não sei o suficiente sobre isso para dizer por que não.

Mooks
fonte
Obrigado pela sua resposta, mas ... Ainda acho que o gx.rma não é apropriado para o que estou tentando fazer, por isso usei a regressão de deming. Porque eu não entendo como o gx.rma realmente explica o erro padrão conhecido ... Mas pode ser que eu esteja entendendo algo errado aqui ... Vou precisar dar uma olhada quando tiver tempo
Nico Coallier
1
O ponto é que você pode calcular um coeficiente de correlação entre x e y (que você mencionou) sem a necessidade de qualquer regressão . Eu acho que você está preocupado com a diferença de uma correlação entre os dados e uma avaliação da qualidade da regressão - eles não são necessariamente a mesma coisa. Pearson ^ 2 fornece o primeiro e, no caso de LS normal (com lm), é o mesmo que R ^ 2. Para LS ortogonais, eles não são. Então, perguntando sobre coeficiente de correlação. e R ^ 2 (especialmente agora que você mencionou erro padrão) são na verdade duas perguntas diferentes. Você pode reformular o OP.
Mooks
Eu poderia não ter sido claro o suficiente .... o que eu quero fazer é o Pearson. Mas o que está me incomodando é que não há R ^ 2 para a regressão total de mínimos quadrados. Eu uso o quadrado mínimo total para ajustar meu coeficiente (inclinação). Mas usarei o Pearson para a correlação, como você sugeriu. Obrigado
Nico Coallier
Eu entendo, é algo que está me incomodando também! Eu acho que deveria haver uma fórmula equivalente para dar um R2 para o total de mínimos quadrados também, mas provavelmente não estou entendendo completamente. Embora, se você deseja apenas ajustar sua inclinação, use a função de minimização que é a base do LS total em Deming. Tente mathworld.wolfram.com/… ou arxiv.org/pdf/math/9805076.pdf . Você também pode considerar a análise de componentes de princípio com prcomp ou princomp - é basicamente o mesmo e talvez eles expulsem algo que ajude.
Mooks
1

Usando o pacote "mcr"

e usando a função para gerar seu modelo de regressão de deming

yourmodel<-mcreg(x, y, ...) # you need to be familiar with the various types of deming constant SD or CV%. these can give very different results. But that's different question.

e produzindo um gráfico usando a função

MCResult.plot(your model)

Isso exibe a correlação do momento de produção de Pearson no gráfico para o modelo, que informa a força e a direção do relacionamento linear entre suas duas variáveis ​​x, y, mas não fornece a proporção da variação explicada.

Espero que ajude.

George
fonte