Quero realizar uma análise ANCOVA dos dados relativos à densidade de epífitas vegetais. Inicialmente, gostaria de saber se existe alguma diferença na densidade da planta entre duas inclinações, uma N e uma S, mas tenho outros dados, como altitude, abertura do dossel e altura da planta hospedeira. Eu sei que minha covariável teria que ser as duas pistas (N e S). Eu construí este modelo que roda em R e, embora eu não tenha idéia se ele tem um bom desempenho. Também gostaria de saber qual é a diferença se eu usar o símbolo +
ou *
.
model1 <- aov(density~slope+altitude+canopy+height)
summary(model1)
model1
Respostas:
A ferramenta básica para isso é
lm
; note queaov
é um invólucro paralm
.Em particular, se você tiver alguma variável de agrupamento (fator), uma covariável contínua , o modelo ajustaria um modelo ANCOVA de efeitos principais, enquanto um modelo que incluísse interação com a covariável. terá as mesmas fórmulas.g x
y ~ x + g
y ~ x * g
aov
Preste atenção especial à
Note
ajuda naaov
.Quanto ao
+
vs*
, russellpierce aborda esse assunto, mas eu recomendo que você veja?lm
e,?formula
principalmente, a seção 11.1 do manual Uma Introdução ao R que acompanha o R (ou você pode encontrá-lo on-line se não tiver descoberto como para encontrá-lo no seu computador; mais facilmente, isso envolve encontrar o menu suspenso "Ajuda" no R ou no RStudio).fonte
anova
(você verá em breve se os dá na ordem errada, porque alguns SS serão negativos se você fizer isso) )Eu recomendo obter e ler Descobrir estatísticas usando R por campo. Ele tem uma boa seção sobre ANCOVA.
Para executar o ANCOVA no R, carregue os seguintes pacotes:
Se você estiver usando
lm
ouaov
(eu usoaov
), certifique-se de definir os contrastes usando a função "contrastes" antes de executar umaov
ou outrolm
. R usa contrastes não ortogonais por padrão, o que pode atrapalhar tudo em uma ANCOVA. Se você deseja definir contrastes ortogonais, use:então execute seu modelo como
Para visualizar o modelo, use:
Certifique-se de usar capital "A"
Anova
aqui e nãoanova
. Isso fornecerá resultados usando SS tipo III.summary.lm(model.1)
dará outro resumo e inclui o R-sq. resultado.Se você deseja testar a homogeneidade das inclinações de regressão, também pode incluir um termo de interação para o IV e a covariável. Isso seria:
Se o termo de interação for significativo, você não terá homogeneidade.
fonte
Aqui está uma documentação complementar http://goo.gl/yxUZ1R do procedimento sugerido por @Butorovich. Além disso, minha observação é que, quando a covariável é binária, o uso do resumo (lm.object) daria a mesma estimativa IV que a gerada pela Anova (lm.object, tipo = "III").
fonte
ASK QUESTION
no topo e perguntando lá. Então podemos ajudá-lo adequadamente.Utilizamos a análise de regressão para criar modelos que descrevem o efeito da variação nas variáveis preditoras na variável resposta. Às vezes, se tivermos uma variável categórica com valores como Sim / Não ou Masculino / Feminino etc., a análise de regressão simples fornecerá vários resultados para cada valor da variável categórica. Nesse cenário, podemos estudar o efeito da variável categórica usando-a juntamente com a variável preditora e comparando as linhas de regressão para cada nível da variável categórica. Essa análise é denominada Análise de Covariância, também denominada ANCOVA.
Exemplo
Considere o
R
conjunto de dados internomtcars
. Nele observamos que o campoam
representa o tipo de transmissão (automática ou manual). É uma variável categórica com os valores 0 e 1. Os valores de milhas por galão (mpg
) de um carro também podem depender dele, além do valor da potência (hp
). Estudamos o efeito do valor deam
na regressão entrempg
ehp
. Isso é feito usando aaov()
função seguida pelaanova()
função para comparar as várias regressões.A entrada de dados
Criar um quadro de dados que contém os campos
mpg
,hp
eam
do conjunto de dadosmtcars
. Aqui tomamosmpg
como variável de resposta,hp
como variável preditora eam
como variável categórica.Quando executamos o código acima, ele produz o seguinte resultado:
Análise ANCOVA
Criamos um modelo de regressão tomando
hp
como variável preditora empg
como variável de resposta levando em consideração a interação entream
ehp
.Modelo com interação entre variável categórica e variável preditora
Criar modelo de regressão1
Quando executamos o código acima, ele produz o seguinte resultado:
Esse resultado mostra que tanto a potência quanto o tipo de transmissão têm efeito significativo em milhas por galão, pois o valor de p em ambos os casos é menor que 0,05. Mas a interação entre essas duas variáveis não é significativa, pois o valor-p é maior que 0,05.
Modelo sem interação entre variável categórica e variável preditora
Crie o modelo de regressão2
Quando executamos o código acima, ele produz o seguinte resultado:
Esse resultado mostra que tanto a potência quanto o tipo de transmissão têm efeito significativo em milhas por galão, pois o valor de p em ambos os casos é menor que 0,05.
Comparando dois modelos
Agora podemos comparar os dois modelos para concluir se a interação das variáveis é realmente insignificante. Para isso, usamos a
anova()
funçãoComo o valor-p é maior que 0,05, concluímos que a interação entre a potência e o tipo de transmissão não é significativa. Portanto, a quilometragem por galão dependerá de maneira semelhante da potência do carro no modo de transmissão automática e manual.
fonte