Gostaria de determinar se o teste de múltiplas comparações seria apropriado para meus dados. Eu usei o teste de Kruskal-Wallis para determinar se havia diferenças na inibição média entre grupos diferentes. A análise revelou que havia diferenças significativas e agora eu gostaria de usar um procedimento de comparação múltipla (talvez o de Dunn, pois tenho tamanhos de amostra desiguais) para ver quais grupos eram diferentes dos demais.
Fiquei me perguntando, pois tenho muitos grupos ( ). Isso faria com que um teste de comparações múltiplas tivesse muito pouco poder ou não fosse apropriado para esse conjunto de dados?
Respostas:
Boa pergunta! Vamos esclarecer algumas possíveis confusões, primeiro. O teste de Dunn (Dunn, 1964) é precisamente o seguinte: uma estatística de teste que é um análogo não paramétrico do teste t pareado seria realizada post hoc a uma ANOVA. É semelhante ao teste de soma de classificação de Mann-Whitney-Wilcoxon, exceto que (1) emprega uma medida da variância combinada que está implícita na hipótese nula do teste de Kruskal-Wallis e (2) usa as mesmas classificações dos dados originais de uma pessoa, como são usados pelo teste de Kruskal-Wallis.
Outros métodos para controlar o FWER existem com mais poder estatístico. Por exemplo, os métodos passo a passo de Holm e Holm-Sidak (Holm, 1979) não têm poder de hemorragia como o método de Bonferroni. Lá também, você poderia ter como objetivo controlar a taxa de falsas descobertas (FDR), e esses métodos - Benjamini-Hochberg (1995) e Benjamini-Yekutieli (2001) - geralmente dão mais poder estatístico ao assumir que algumas hipóteses nulas são falsas (ou seja, construindo a ideia de que nem todas as rejeições são falsas em critérios de rejeição modificados sequencialmente). Esses e outros ajustes de múltiplas comparações são implementados especificamente para o teste de Dunn no Stata no pacote dunntest (no tipo Stata
net describe dunntest, from(https://alexisdinno.com/stata)
) e em R no pacote dunn.test .Além disso, existe uma alternativa ao teste de Dunn (que é baseado em uma estatística aproximada do teste z ): o Conover-Iman (exclusivamente) post hoc a um teste rejeitado de Kruskal-Wallis (que é baseado em uma distribuição t , e que é mais poderoso que o teste de Dunn; Conover & Iman, 1979; Convover, 1999). Também é possível usar os métodos para controlar o FWER ou o FDR com os testes Conover-Iman, que são implementados para Stata no pacote conovertest (dentro do tipo Stata
net describe conovertest, from(https://alexisdinno.com/stata)
) e para R no pacote conover.test .Referências
Benjamini, Y. e Hochberg, Y. (1995). Controlando a taxa de falsas descobertas: uma abordagem prática e poderosa para testes múltiplos . Jornal da Sociedade Estatística Real . Série B (Metodológica), 57 (1): 289–300.
Benjamini, Y. e Yekutieli, D. (2001). O controle da taxa de descoberta falsa em vários testes sob dependência . Annals of Statistics , 29 (4): 1165-1188.
Conover, WJ (1999). Estatística não paramétrica prática . Wiley, Hoboken, NJ, 3ª edição.
Conover, WJ e Iman, RL (1979). Em procedimentos de comparações múltiplas . Relatório Técnico LA-7677-MS, Laboratório Científico Los Alamos.
Dunn, JO (1961). Comparações múltiplas entre médias . Jornal da Associação Estatística Americana , 56 (293): 52–64.
Dunn, JO (1964). Comparações múltiplas usando somas de classificação . Technometrics , 6 (3): 241–252.
Holm, S. (1979). Um procedimento de teste múltiplo sequencialmente rejeitador . Scandinavian Journal of Statistics , 6 (65-70): 1979.
fonte