Considere a seguinte regressão binomial:
# Create some data
set.seed(10)
n <- 500
x <- runif(n,0,100)
y <- x + rnorm(n,sd=100) < 0
# Fit a binomial regression model
model <- glm(y ~ x, family="binomial")
summary(model)
A summary
função retorna um valor-p de 1.03e-05
. Ao usar anova.glm
, obtém-se valores-p ligeiramente mais extremos, independentemente do método usado para calcular o valor-p.
anova(model, test="Rao") # p.value = 7.5e-6
anova(model, test="LRT") # p.value = 6.3e-6
anova(model, test="Chisq") # p.value = 6.3e-6
O valor-p da summary
função se aplica à mesma hipótese que os retornados pela anova
função? Se sim, como summary
calculou esse valor-p e é possível executar o mesmo cálculo diretamente anova
?
Respostas:
Pode ajudar você a ler minha resposta aqui: Por que meus valores p diferem entre a saída da regressão logística, o teste qui-quadrado e o intervalo de confiança para a sala de cirurgia? Sua pergunta aqui é quase uma duplicata, mas há alguns elementos adicionais na sua pergunta que podem ser abordados.
summary.glm()
Usar
anova.glm()
permite acessar diferentes testes. Quando você definetest="Rao"
, ele fornece o valor p de um teste de pontuação. E quando você define umtest="Chisq"
outest="LRT"
(eles são iguais), fornece o valor p de um teste de razão de verossimilhança.A
anova.glm()
função testa a mesma hipótese nula que o teste Wald nasummary()
saída nesse caso . Isso ocorre apenas porque seu modelo possui apenas uma variável. Aanova.glm()
função executará testes sequenciais, que são análogos ao 'tipo I SS' em uma configuração linear, enquanto os testes de Wald desummary()
são análogos ao 'tipo III SS' em uma configuração linear (veja minha resposta aqui: Como interpretar o tipo I, tipo II e tipo III ANOVA e MANOVA? ). Considerar:Você pode usar a
anova.glm()
função para fornecer testes de razão de pontuação e de probabilidade de variáveis individuais em um modelo de regressão logística múltipla que são análogos ao 'SS tipo III', mas é tedioso. Você precisaria continuar reajustando seu modelo para que cada variável, por sua vez, seja listada por último na fórmula fornecida para aglm()
chamada. O último valor p listado naanova.glm()
saída é aquele que será análogo ao 'tipo III SS'.Para obter os testes de pontuação ou razão de verossimilhança de variáveis individuais de forma mais conveniente, use em seu
drop1()
lugar. Considerar:fonte
Em
R
, asummary
função paraglm
calcula o valor-p usando uma estatística simples de Wald, ou seja,Para recriar isso a partir da sua saída, tente
fonte