Eu gostaria de testar a diferença na resposta de duas variáveis para um preditor. Aqui está um exemplo mínimo reproduzível.
library(nlme)
## gls is used in the application; lm would suffice for this example
m.set <- gls(Sepal.Length ~ Petal.Width, data = iris,
subset = Species == "setosa")
m.vir <- gls(Sepal.Length ~ Petal.Width, data = iris,
subset = Species == "virginica")
m.ver <- gls(Sepal.Length ~ Petal.Width, data = iris,
subset = Species == "versicolor")
Eu posso ver que os coeficientes da inclinação são diferentes:
m.set$coefficients
(Intercept) Petal.Width
4.7771775 0.9301727
m.vir$coefficients
(Intercept) Petal.Width
5.2694172 0.6508306
m.ver$coefficients
(Intercept) Petal.Width
4.044640 1.426365
Eu tenho três perguntas:
- Como posso testar a diferença entre pistas?
- Como posso testar a diferença entre as variações residuais?
- Qual é uma maneira simples e eficaz de apresentar essas comparações?
Uma questão relacionada, Método para comparar o coeficiente de variável em dois modelos de regressão , sugere re-executar o modelo com uma variável dummy para diferenciar as inclinações; existem opções que permitiriam o uso de conjuntos de dados independentes?
Respostas:
Como posso testar a diferença entre pistas?
Incluir um manequim para a espécie, deixá-lo interagir com , e ver se este manequim é significativo. Vamos L i ser o comprimento sépalas e P i seja a largura do pedal e S 1 , S 2 , S 3 ser as variáveis indicadoras para as três espécies. A comparar o modeloPi Li Pi S1,S2,S3
logLik
Qual é uma maneira simples e eficaz de apresentar a comparação?
Editar: notei que outra pergunta foi adicionada ao corpo. Então, eu estou adicionando uma resposta para isso:
Como posso testar a diferença entre as variações residuais?
Para isso, você precisará estratificar o conjunto de dados e ajustar modelos separados, pois o modelo baseado em interação que eu sugeri restringirá a variação residual para ser a mesma em todos os grupos. Se você ajustar modelos separados, essa restrição desaparecerá. Nesse caso, você ainda pode usar o teste da razão de verossimilhança (a probabilidade do modelo maior agora é calculada somando as probabilidades dos três modelos separados). O modelo "nulo" depende do que você deseja compará-lo
fonte
gls(Sepal.Length ~ species:Petal.Width, data = iris)
species
for uma variável categórica, achogls(Sepal.Length ~ species*Petal.Width, data=iris)
que seria a sintaxe.gls
modelo, mas permitindo diferentes variações residuais para cada espécie com a opçãoweights=varIdent(form=~1|Species)
(em relação à segunda pergunta)?Para responder a essas perguntas com o código R, use o seguinte:
1. Como posso testar a diferença entre inclinações?
Resposta: Examine o valor de p ANOVA da interação Petal.Width by Species e compare as inclinações usando lsmeans :: lstrends, como a seguir.
2. Como posso testar a diferença entre as variações residuais?
Se eu entendi a pergunta, você pode comparar as correlações de Pearson com uma transformação de Fisher, também chamada de "r-to-z de Fisher", como segue.
3. Qual é uma maneira simples e eficaz de apresentar essas comparações?
"Utilizamos regressão linear para comparar a relação entre o comprimento do septo e a largura da pétala para cada espécie. Não encontramos uma interação significativa nas relações entre o comprimento do sepal e a largura da pétala para I. Setosa (B = 0,9), I. Versicolor (B = 1,4), nem I. Virginica (B = 0,6); F (2, 144) = 1,6, p = 0,19 Uma comparação de Fisher para z indicou que a correlação de Pearson para I. Setosa (r = 0,28) foi significativamente menor (p = 0,02) do que I. Versicolor (r = 0,55). Da mesma forma, a correlação para I. Virginica (r = 0,28) foi significativamente mais fraca (p = 0,02) do que a observada para I. Versicolor. "
Por fim, sempre visualize seus resultados!
fonte
Eu concordo com a sugestão anterior. Você deve ajustar um modelo de regressão múltipla com uma variável dummy para cada conjunto de dados. Isso permitirá que você teste se as interceptações diferem. Se você também deseja saber se o cartão / sai da cadeia sem solução que o levará a solucionar esse problema sem reunir uma nova amostra e executar o estudo novamente. inclinações diferem, precisará incluir também interações entre os manequins e a variável em questão. Não há problema com o fato de os dados serem independentes. Nota que, se eles são ambos independente e (por exemplo) de espécies diferentes, então você não seria capaz de dizer se a diferença que você encontrará é devido às espécies diferentes ou os conjuntos de dados diferentes, como eles são perfeitamente confundido. No entanto, não há teste
fonte