Quando usar a regressão de Deming

9

Atualmente, estou trabalhando em uma maneira de transformar dois valores de teste de fósforo diferentes um no outro.

fundo

Existem muitos métodos (de extração) para medir o fósforo disponível na planta no solo. Países diferentes aplicam métodos diferentes; portanto, para comparar a fertilidade P entre países, é necessário calcular o valor do teste P x ​​com base no valor do teste P ye vice-versa. Portanto, resposta e covariável são intercambiáveis.

Quantidade de P no extrator 1 = P_CAL em [mg / 100g de solo]

Quantidade de P no extrator 2 = P_DL em [mg / 100g de solo]

Para estabelecer essa "equação de transformação", o conteúdo de P de 136 amostras de solo foi analisado com extrato de CAL e DL. Parâmetros adicionais como pH do solo, carbono orgânico total, nitrogênio total, argila e carbonato também foram medidos. O objetivo é derivar um modelo de regressão simples. Em uma segunda etapa, também um modelo múltiplo.

Para fornecer uma visão geral dos dados, mostro dois gráficos de dispersão com uma linha de regressão linear simples (OLS). a) Regressão OLS simples para CAL-P ~ DL-P, b) Regressão OLS simples para DL-P ~ CAL-P

Questões:

No meu entender, a definição de regressão é adequada se a variável resone (y) e explicativa (x) tiverem erros (de medição) e forem intercambiáveis. A regressão de Deming assume que a taxa de variação é conhecida. Como não tenho detalhes sobre a precisão das medições de extração de P, existe outra maneira de determinar a razão de variância? Qual variação significa aqui? Presumo que NÃO é calculado var(DL_P)/var(CAL_P)?

Q1: Como determino a taxa de variação para definir a regressão?

Um caso especial de deming regressão é a regressão ortogonal. Pressupõe razão de variância = 1.

P2: Existe uma maneira de diagnosticar se a suposição δ = 1 está "aproximadamente" correta ou se a suposição (falsa) acarreta erros de previsão elevados?

Se eu assumir δ = 1, a regressão ortogonal fornece a seguinte saída (arredondada)

library(MethComp) deming <- Deming(y=P_CAL, x=P_DL, vr=1)

Interceptação: 0,75; Inclinação: 0,71; sigma P_DL: 3,17; sigma P_CAL: 3.17

A plotagem da linha de regressão de deming nas plotagens acima mostra que a regressão de deming é muito próxima da regressão a) CAL-P = f (DL-P), mas muito diferente de b) DL-P = f (CAL-P) equação. insira a descrição da imagem aqui

Q3: é correto que, na regressão ortogonal, CAL-P = f (DL-P) e DL-P = f (CAL-P) sejam expressos com a mesma equação? Caso contrário, como derivar equações corretas para ambos? Do que sinto falta aqui?

Devido às propriedades de ambas as soluções de extração, os valores de DL-P tendem a ser cerca de 25% mais altos que os valores de CAL-P, portanto, CAL-P = f (DL-P) deve ter uma inclinação maior que DL-P = f (CAL -P). No entanto, isso não é expresso na deposição de regressão quando há apenas uma inclinação. O que me deixa com minha pergunta final.

Q4: a análise da regressão é uma abordagem válida para o meu propósito?

asugila
fonte
11
A razão dos dois desvios padrão é assumida na regressão de Deming para decidir onde deixar cair a perpendicular à linha. Se a razão for 1, as variações são consideradas iguais e a distância medida a partir de um ângulo de 45 graus. Você não pode determinar essa proporção a partir dos dados.
Michael R. Chernick

Respostas:

2

Para resolver parte de suas preocupações aqui: A regressão de Deming parece oferecer um ajuste inadequado no painel de plotagem B, mas isso ocorre porque a plotagem está incorreta. Uma maneira rápida de avaliar se isso foi feito corretamente é examinar os valores de X e Y ao longo da linha de regressão de Deming. Para qualquer valor de DL-P no painel A, ele deve ter um valor correspondente de CAL-P idêntico nos dois painéis (NÃO é verdade para OLS e a diferença fundamental entre eles). Mas nessas plotagens, onde DL-P = 20, CAL-P no painel A é ~ 15 e no painel B ~ 27.

O erro parece ser que a linha de regressão de Deming foi desenhada apenas trocando os termos CAL-P e DL-P na equação. A equação para o painel A é:

CAL-P = 0,75 + 0,71 * DL-P

Reorganizando, isso implica que a equação para o painel B deve ser:

DL-P = (CAL-P - 0,75) / 0,71

E não:

DL-P = 0,75 + 0,71 * CAL-P (que é o que foi plotado)

mkt - Restabelecer Monica
fonte