Eu tenho um dado que onde o resultado é a proporção de uma espécie observada em uma área por uma máquina em 2 dias separados. Como o resultado é uma proporção e não inclui 0 ou 1, usei uma regressão beta para ajustar-se ao modelo. A temperatura é usada como uma variável independente. Aqui está um código R de brinquedo:
set.seed(1234)
library(betareg)
d <- data.frame(
DAY = c(1,1,1,1,2,2,2,2),
Proportion = c(.4,.1,.25, .25, .5,.3,.1,.1),
MACHINE = c("A","B","C","D","H","G","K","L"),
TEMPERATURE = c(rnorm(8)*100)
)
b <- betareg(Proportion ~ TEMPERATURE,
data= d, link = "logit", link.phi = NULL, type = "ML")
summary(b)
## Call:
## betareg(formula = Proportion ~ TEMPERATURE, data = d, link = "logit", link.phi = NULL, type = "ML")
##
## Standardized weighted residuals 2:
## Min 1Q Median 3Q Max
## -1.2803 -1.2012 0.3034 0.6819 1.6494
##
## Coefficients (mean model with logit link):
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.0881982 0.2620518 -4.153 3.29e-05 ***
## TEMPERATURE 0.0003469 0.0023677 0.147 0.884
##
## Phi coefficients (precision model with identity link):
## Estimate Std. Error z value Pr(>|z|)
## (phi) 9.305 4.505 2.066 0.0389 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Acima, você pode ver o TEMPERATURE
coeficiente é 0,0003469. Exponenciação, exp (.0003469) = 1.000347
Atualização incorporando respostas e comentários:
Você pode ver aqui como o aumento da temperatura em 1 unidade de -10 a 10 aumenta a proporção
nd <- data.frame(TEMPERATURE = seq(-10, 10, by = 1))
nd$Proportion <- predict(b, newdata = nd)
nd$proportion_ratio <- nd$Proportion/(1 - nd$Proportion)
plot(Proportion ~ TEMPERATURE, data = nd, type = "b")
A interpretação é: Uma alteração de 1 unidade TEMPERATURE
leva a uma alteração relativa de 1.000347 ± 0,04% no Proportion
:
A palavra chave é mudança relativa por isso, quando você compara exp(coef(b))[2]
a nd$proportion_ratio[2] / nd$proportion_ratio[1]
você verá que eles são os mesmos
## ratio of proportion
nd$proportion_ratio[2] / nd$proportion_ratio[1]
exp(coef(b))[2]
nd$proportion_ratio[-1] / nd$proportion_ratio[-20]
fonte
Proportion
é isso que o nome sugere, é discreto, e não a regressão contínua e logística seria provavelmente mais apropriada para modelá-lo.Respostas:
Sim, o link do logit pode ser interpretado assim. Não é apenas uma mudança nas "probabilidades" (= razão de probabilidades), mas uma mudança na proporção de proporções. Mais formalmente, a equação do modelo para a expectativa é a mesma da regressão logística: onde . Para sua configuração, isso significa: Assim, uma alteração absoluta de 1 unidade em leva a uma mudança relativa de
Com um pouco de prática, você pode ter uma razoável do que isso significa na esperada . Se você ainda não tem esse sentimento, pode calcular facilmente os efeitos das alterações em , por exemplo:P r o p o r t i o n T e mp e r a t u r e
para verificar quais são as alterações absolutas em
Proportion
determinadas alterações absolutasTEMPERATURE
.fonte
predict
método pode dar-lhe o esperado , ou apenas o preditor linear ( ), o parâmetro , a variância, quantis, etc."response"
"link"
"precision"
GasolineYield
dadosyield = 0.5
significa que a proporção de 50% do petróleo bruto é convertida em gasolina. Isso corresponde a uma proporção de 1 = 0,5 / 0,5, ou seja, tanto petróleo bruto é convertido quanto não convertido. Se isso aumentar em 10%, a nova proporção será de 1,1, correspondendo a uma proporção de cerca de 0,5238. Assim, as etapas computacionais são essencialmente as mesmas que no modelo de logit. Re: explicação para leigos. Minha experiência é que também é muito difícil entender a razão de chances ... portanto, uso muito gráficos de efeitos.