Intervalos de confiança do teste de Holm-Bonferroni?

10

Sou iniciante no problema de múltiplas comparações. Gostaria de saber como calcular intervalos de confiança para o método Holm-Bonferroni?

Eu sei que, para o método Bonferroni, podemos simplesmente mudar o nível de confiança de para .1α1αm

Este método também funciona para Holm-Bonferroni?

Edit: Parece que o método HB não fornece um procedimento para corrigir o conf. intervalo. Mas você gostaria de comentar: posso usar um método para correção do valor p e outro para correção do intervalo?

Macaronnos
fonte

Respostas:

5

[Esta resposta foi completamente reescrita de ontem.]

Primeira nomenclatura. O método Holm também é chamado de método Holm step-down , ou o método Holm-Ryan . São todos iguais. Qualquer que seja o nome usado, existem dois cálculos alternativos. O método Holm original é baseado em Bonferroni. Um método alternativo um pouco mais poderoso é baseado no Sidak, assim chamado de Holm-Sidak.

O método Holm pode ser usado para múltiplas comparações em vários contextos. Sua entrada é uma pilha de valores P. Um uso é seguir a ANOVA, comparando pares de médias enquanto corrige várias correções. Quando isso é feito, tanto quanto posso ver, é muito raro relatar intervalos de confiança (corrigidos para múltiplas comparações, também chamados de intervalos de confiança simultâneos), bem como conclusões sobre a significância estatística e os valores de P ajustados à multiplicidade.

Encontrei dois trabalhos que explicam como calcular esses intervalos de confiança, mas eles diferem.

Serlin, R. (1993). Intervalos de confiança e o método científico: um caso para Holm no intervalo. Journal of Experimental Education, 61 (4), 350-360.

insira a descrição da imagem aqui

Ludbrook, J. MÚLTIPLAS INFERÊNCIAS USANDO INTERVALOS DE CONFIANÇA. Farmacologia e Fisiologia Clínica e Experimental (2000) 27, 212–215

insira a descrição da imagem aqui

Para as comparações com os menores valores de P, os dois métodos são os mesmos (mas um usa C como o número de comparações e o outro usa m ). Mas para as comparações com valores maiores de P, os dois métodos diferem. Para a comparação com o maior valor de P, Ludbrook calcularia o IC 95% normalmente, sem correção para comparações múltiplas. Serlin usaria o mesmo ajuste para todas as comparações com um valor de P ajustado maior que 0,05 (supondo que você queira intervalos de 95%), portanto, os intervalos para as comparações com valores de P grandes seriam maiores do que os que o método Ludbrook gera.

Ambos os métodos usam a abordagem de Bonferroni, mas podem ser facilmente ajustados à abordagem de Sidak.

Alguma idéia de qual método está correto / melhor?

Harvey Motulsky
fonte
Se você tiver um valor P, poderá conseguir um intervalo de confiança. Um valor P unicaudal indica que a hipótese nula está no limite de um intervalo de confiança de 100 * (1-P)%. Talvez você possa iterativamente ajustar o nulo até que o valor P saia como alfa para a largura do intervalo de confiança desejada.
Michael Lew
Mas observe que os ajustes de multiplicidade, pela natureza do paradigma freqüentista, não são prescritos pela teoria e são um tanto arbitrários. Eles não estão necessariamente ligados a intervalos de confiança. Há casos, por exemplo, em testes seqüenciais em grupo em que é possível parar a rejeição precoce de e ainda ter o intervalo de confiança corrigido pela multiplicidade para o efeito do tratamento incluir zero. H0
25815 Frank Harrell