interpretação de betareg coef

8

Eu tenho um dado que onde o resultado é a proporção de uma espécie observada em uma área por uma máquina em 2 dias separados. Como o resultado é uma proporção e não inclui 0 ou 1, usei uma regressão beta para ajustar-se ao modelo. A temperatura é usada como uma variável independente. Aqui está um código R de brinquedo:

set.seed(1234)
library(betareg)
d <- data.frame(
  DAY = c(1,1,1,1,2,2,2,2),
  Proportion = c(.4,.1,.25, .25, .5,.3,.1,.1),
  MACHINE = c("A","B","C","D","H","G","K","L"),
  TEMPERATURE = c(rnorm(8)*100)
)
b <- betareg(Proportion ~ TEMPERATURE,
  data= d, link = "logit", link.phi = NULL, type = "ML")
summary(b)
## Call:
## betareg(formula = Proportion ~ TEMPERATURE, data = d, link = "logit", link.phi = NULL, type = "ML")
## 
## Standardized weighted residuals 2:
##     Min      1Q  Median      3Q     Max 
## -1.2803 -1.2012  0.3034  0.6819  1.6494 
## 
## Coefficients (mean model with logit link):
##               Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -1.0881982  0.2620518  -4.153 3.29e-05 ***
## TEMPERATURE  0.0003469  0.0023677   0.147    0.884    
## 
## Phi coefficients (precision model with identity link):
##       Estimate Std. Error z value Pr(>|z|)  
## (phi)    9.305      4.505   2.066   0.0389 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Acima, você pode ver o TEMPERATUREcoeficiente é 0,0003469. Exponenciação, exp (.0003469) = 1.000347

Atualização incorporando respostas e comentários:

Você pode ver aqui como o aumento da temperatura em 1 unidade de -10 a 10 aumenta a proporção

nd <- data.frame(TEMPERATURE = seq(-10, 10, by = 1))
nd$Proportion <- predict(b, newdata = nd)
nd$proportion_ratio <- nd$Proportion/(1 - nd$Proportion)
plot(Proportion ~ TEMPERATURE, data = nd, type = "b")

A interpretação é: Uma alteração de 1 unidade TEMPERATUREleva a uma alteração relativa de 1.000347 ± 0,04% no Proportion:

E(Proportion)1E(Proportion)

A palavra chave é mudança relativa por isso, quando você compara exp(coef(b))[2]a nd$proportion_ratio[2] / nd$proportion_ratio[1] você verá que eles são os mesmos

## ratio of proportion
nd$proportion_ratio[2] / nd$proportion_ratio[1] 
exp(coef(b))[2]
nd$proportion_ratio[-1] / nd$proportion_ratio[-20]
user3022875
fonte
Se Proportioné isso que o nome sugere, é discreto, e não a regressão contínua e logística seria provavelmente mais apropriada para modelá-lo.
Tim
Tim, por que? Proporção pode ser uma razão de duas concentrações. O usuário relatou valor na escala de 1 a 100 (fração dos 100%). Nos dois casos, a proporção é contínua. No primeiro caso, é positivo (pode ser> 1, dependendo do que é dividido pelo que), no segundo caso; é truncado em 0 e 1. #
Natalie

Respostas:

10

Sim, o link do logit pode ser interpretado assim. Não é apenas uma mudança nas "probabilidades" (= razão de probabilidades), mas uma mudança na proporção de proporções. Mais formalmente, a equação do modelo para a expectativa é a mesma da regressão logística: onde . Para sua configuração, isso significa: Assim, uma alteração absoluta de 1 unidade em leva a uma mudança relativa de

logit(μi)=xiβ
μi=E(yi)
logit(E(Proportion))=1.31+0.004TemperatureE(Proportion)1E(Proportion)=exp(1.31+0.004Temperature)
Temperatureexp(0.004)0.4%em .E(Proportion)/(1E(Proportion))

Com um pouco de prática, você pode ter uma razoável do que isso significa na esperada . Se você ainda não tem esse sentimento, pode calcular facilmente os efeitos das alterações em , por exemplo:ProportionTemperature

nd <- data.frame(TEMPERATURE = seq(-150, 150, by = 50))
nd$Proportion <- predict(b, newdata = nd)
print(nd)
plot(Proportion ~ TEMPERATURE, data = nd, type = "b")

para verificar quais são as alterações absolutas em Proportiondeterminadas alterações absolutas TEMPERATURE.

Achim Zeileis
fonte
Obrigado pela sua resposta. Para ficar claro, o 1.004 no meu exemplo significaria que um aumento de 1 unidade na temperatura resulta na proporção de espécies observadas por QUALQUER máquina para subir 0,4%? Quando você diz "Não é uma mudança nas probabilidades, mas uma mudança na proporção das proporções", existe alguma maneira de postar a matemática que descreve isso ou a chamada de previsão (b, newdata) pode ser codificada manualmente para que a matemática de como o coefs do modelo são convertidos em proporções? Vejo que prever é pegar os coefs e novos dados de temperatura e mostrar um relacionamento crescente, mas a matemática ainda é imprecisa. Mais uma vez obrigado!
precisa saber é o seguinte
É quase o mesmo que no caso de regressão logística - veja minha resposta atualizada. Portanto, os cálculos são essencialmente os mesmos, mas o resultado não é uma probabilidade, mas uma proporção. Observe, no entanto, que para a distribuição beta modelada, há mais aspectos que você pode modelar do que apenas a expectativa. O predictmétodo pode dar-lhe o esperado , ou apenas o preditor linear ( ), o parâmetro , a variância, quantis, etc."response" μi"link""precision"ϕi
Achim Zeileis
Você pode ser mais claro? com exp (0,004) - um aumento de 1 unidade na temperatura aumenta a razão de chances de quê? em 0,04%? um público leigo não vai entender aumento "E / 1-E"
user3022875
Quando você declara "Portanto, os cálculos são essencialmente os mesmos, mas o resultado não é uma probabilidade, mas uma proporção". A proporção que você está se referindo à proporção original ou uma proporção de uma proporção? Na regressão logística, a razão de chances é a razão entre as chances de pertencer a uma categoria e de não estar na categoria, mas o que significa a razão de chances quando não há categoria e o ID é um número contínuo (0,1)? Você pode fornecer uma interpretação dos 0,04% que não envolve fórmulas que os leigos entenderiam?
user3022875
A proporção é a proporção original, por exemplo, nos GasolineYielddados yield = 0.5significa que a proporção de 50% do petróleo bruto é convertida em gasolina. Isso corresponde a uma proporção de 1 = 0,5 / 0,5, ou seja, tanto petróleo bruto é convertido quanto não convertido. Se isso aumentar em 10%, a nova proporção será de 1,1, correspondendo a uma proporção de cerca de 0,5238. Assim, as etapas computacionais são essencialmente as mesmas que no modelo de logit. Re: explicação para leigos. Minha experiência é que também é muito difícil entender a razão de chances ... portanto, uso muito gráficos de efeitos.
Achim Zeileis