Ao calcular modelos de regressão com R, uso regularmente a função relevel para fazer com que meu modelo me dê resultados para o outro nível. Percebi que, às vezes, mas não com frequência, isso mudou o modelo no sentido de que os níveis de outros fatores que eram significativos antes da relevância não são mais. Isso é inerente à relevância ou é excepcional e talvez devido a algum problema com meus dados? Isso mostra que meus dados provavelmente não atendem a um dos pré-requisitos de modelos lineares?
Relacionado a isso, tudo bem se eu usar o relevel, recalcular meu modelo e relatar valores de significância de ambos os modelos no meu artigo? Se a significância difere entre os dois modelos para um determinado fator, suponho que devo seguir um que seja menos otimista?
Suponho que minha pergunta trai que não conheço o suficiente sobre lm para entender a necessidade de um nível básico. Eu pensei que tinha entendido muito bem;) De alguma forma, nenhuma das apresentações que li explicava esse ponto, ou eu estava muito boba para entender. Portanto, se alguém pudesse me direcionar para um site onde o ponto de ter níveis básicos em lm é explicado ou explicado por conta própria, isso seria ótimo também!
Edit: Aqui está um exemplo mínimo:
library(datasets)
sprays<-OrchardSprays
model<-lm(decrease~treatment+rowpos+colpos,data=sprays)
summary(model)
Parte do resumo diz
treatmentC 20.625 9.731 2.120 0.03866 *
Portanto, se o tratamento == C, isso tem influência positiva significativa na 'diminuição'. Agora eu relevante 'tratamento' para B para descobrir que influência o tratamento == A tem:
sprays$treatment<-relevel(sprays$treatment,"B")
summary(model)
E agora o tratamento == C não é significativo neste novo modelo:
treatmentC 17.625 9.731 1.811 0.07567 .
Desculpe por postar no lugar errado! Posso mover minha pergunta para stats statexchange ou devo abrir uma nova lá?
fonte
d <- data.frame(y=runif(300),f=factor(rep(LETTERS[1:3],each=100)); lm(y~f,data=d)
lhe dará um começo, embora, é claro, não haja mudanças significativas nesse caso (embora as estimativas de parâmetros e os valores-p certamente mudem quando você for relevante).Respostas:
Suponha que o fator
conditions
tenha níveisA,B,C
e você regride sua variável de resposta de acordoy
com as condiçõesmod <- lm(y ~ conditions)
. Agorasummary(mod)
retorna a média do nível de referência deconditions
(digamosA
) e a diferença de médias entre condiçõesB
eA
e a diferença entre as condiçõesC
eA
(relatado como respectivamente(Intercept)
,conditions:B
econditions:C
). Se vocêconditions <- relevel(conditions, ref = 'B')
e reunir novamente o modelo linear, agora obterá a média deB
, a diferença entreA
eB
, e a diferença entreC
eA
. Naturalmente, os valores de p podem mudar. Isso não significa que há um problema com seus dados. Isso não significa que seus dados falhem necessariamente em uma suposição do modelo linear. O ajuste é o mesmo e você simplesmente alterou as informações impressas, porque alterou o nível de referência e está usando contrastes de tratamento. Você pode obter os mesmos testes de hipóteses lineares usando o originalmod
.Quanto ao que relatar, em muitos campos, é habitual relatar se houve um efeito estatisticamente significativo
conditions
(usando a saída deanova(mod)
) e relatar a saída completa da regressão em uma tabela (usando os níveis de referência desejados ) As normas sobre como e se deve relatar testes deA
vs.B
(por exemplo) variam de acordo com o campo. Dê uma olhada em bons papéis em seu campo.fonte