Testes post hoc em ANCOVA

13

Pergunta: Qual é um bom método para realizar testes post hoc de diferenças entre médias de grupos após o ajuste para o efeito de uma covariável?

Exemplo prototípico:

  • Quatro grupos, 30 participantes por grupo (por exemplo, quatro populações diferentes de psicologia clínica)
  • Variável dependente é numérica (por exemplo, pontuações de inteligência)
  • A covariável é numérica (por exemplo, índice de status socioeconômico)
  • As perguntas da pesquisa dizem respeito a se algum par de grupos é significativamente diferente na variável dependente após o controle da covariável

Questões relacionadas :

  • Qual é o método preferido?
  • Quais implementações estão disponíveis no R?
  • Existem referências gerais sobre como uma covariável altera os procedimentos para a realização de testes post hoc?
Jeromy Anglim
fonte
Você pode querer ler aqui também. stackoverflow.com/questions/23628323/…
James Holland

Respostas:

13

Testes múltiplos após ANCOVA, ou mais geralmente qualquer GLM, mas as comparações agora se concentram no grupo / tratamento ajustado ou nas médias marginais (ou seja, quais seriam as pontuações se os grupos não diferissem na covariada de interesse). Que eu saiba, os testes Tukey HSD e Scheffé são usados. Ambos são bastante conservadores e tendem a limitar a taxa de erro do tipo I. O último é preferido no caso de tamanho de amostra desigual em cada grupo. Parece que me lembro que algumas pessoas também usam a correção de Sidak em contrastes específicos (quando é interessante, é claro), pois é menos conservador do que a correção de Bonferroni.

Esses testes estão prontamente disponíveis no multcomppacote R (consulte ?glht). A vinheta de acompanhamento inclui exemplo de uso no caso de um modelo linear simples (seção 2), mas pode ser estendida a qualquer outro modelo de modelo. Outros exemplos podem ser encontrados nos HHpacotes (consulte ?MMC). Vários procedimentos de MCP e reamostragem (recomendados para inferências fortes, mas se baseiam em uma abordagem diferente para a correção da inflação da taxa de erro tipo I) também estão disponíveis no multtestpacote, através do Bioconductor , consulte as referências (3–4). A referência definitiva à comparação múltipla é o livro dos mesmos autores: Dudoit, S. e van der Laan, MJ, Multiple Testing Procedures with Applications to Genomics (Springer, 2008).

A referência 2 explicou a diferença entre o MCP no caso geral (ANOVA, trabalhando com médias não ajustadas) vs. ANCOVA. Também existem vários artigos dos quais não me lembro, mas vou examiná-los.

Outras referências úteis:

  1. Westfall, PH (1997). Teste múltiplo de contrastes gerais usando restrições e correlações lógicas. JASA 92 : 299-306.
  2. Westfall, PH e Young, SS (1993) Reamostragem com base em testes múltiplos, exemplos e métodos para ajuste de valor de p . John Wiley e Filhos: Nova York.
  3. Pollard, KS, Dudoit, S. e van der Laan, MJ (2004). Múltiplos procedimentos de teste: R multtest Package e Applications to Genomics .
  4. Taylor, SL Lang, DT e Pollard, KS (2007). Melhorias no pacote de testes múltiplos multtest . R News 7 (3) : 52-55.
  5. Bretz, F., Genz, A. e Hothorn, LA (2001). Sobre a disponibilidade numérica de vários procedimentos de comparação. Biometrical Journal , 43 (5) : 645-656.
  6. Hothorn, T., Bretz, F. e Westfall, P. (2008). Inferência Simultânea em Modelos Paramétricos Gerais . Departamento de Estatística: Relatórios Técnicos, Nr. 19

Os dois primeiros são referenciados no SAS PROC relacionados ao MCP.

chl
fonte
3

Esta é uma pergunta interessante. Eu acho que é preciso ter muito cuidado com isso, já que a maioria dos softwares que fazem comparação pós-hoc após ANCOVAs o faz, mas de forma não ajustada.

O teste de Bryan Paulson Tukey (BPT) é recomendado para comparação por pares em meios AJUSTADOS, outro procedimento pode ser o teste condicional de Tukey Kramer.

AnastD
fonte
2

Combinando métodos simples que você pode acessar facilmente a partir de R e princípios gerais, você pode usar o HSD de Tukey com bastante simplicidade. O termo de erro da ANCOVA fornecerá o termo de erro para os intervalos de confiança.

No código R, isso seria ...

#set up some data for an ANCOVA
n <- 30; k <- 4
y <- rnorm(n*k)
a <- factor(rep(1:k, n))
cov <- y + rnorm(n*k)

#the model
m <- aov(y ~ cov + a)

#the test
TukeyHSD(m)

(ignore o erro no resultado, isso significa apenas que a covariável não foi avaliada, e é isso que você deseja)

Isso fornece intervalos de confiança mais estreitos do que você obtém se você executar o modelo sem a cobertura ... como esperado.

Qualquer técnica post hoc que dependa dos resíduos do modelo para a variação de erro pode ser facilmente usada.

John
fonte
0

Por que você está se incomodando e se confundindo?

Você pode consultar Discovering Statistics Using SPSS (3a edição), de Andy Field, pp. 401-404.

Usando a função contrastes ou comparando a opção de efeitos principais, você pode fazer o post hoc facilmente em meios ajustados depois de considerar a covariável.

Masood Siyyari
fonte