Tanto na literatura sobre a taxa de erro familiar (FWER) quanto na taxa de falsas descobertas (FDR), métodos particulares de controle da FWER ou FDR são considerados apropriados para testes dependentes ou independentes. Por exemplo, no artigo de 1979 "Um procedimento simples de teste múltiplo sequencialmente rejeitivo", Holm escreveu para contrastar seu método de Šidák de intensificação contra seu método de controle de Bonferroni:
A mesma simplicidade computacional é obtida quando as estatísticas de teste são independentes .
Em "Controlando a taxa de falsas descobertas" de Benjamini e Hochberg (1995), os autores escrevem:
Teorema 1. Para estatísticas de teste independentes e para qualquer configuração de hipóteses nulas falsas, o procedimento acima controla o FDR em .
Mais tarde, em 2001, Benjamini e Yekutieli escrevem:
1.3 O problema . Ao tentar usar a abordagem FDR na prática, as estatísticas de teste dependentes são encontradas com mais frequência do que as independentes , sendo o exemplo de vários pontos de extremidade acima mencionado.
Que significados particulares de dependente e independente esses autores estão usando? Eu ficaria feliz em definições formais do que torna os testes dependentes ou independentes um do outro se eles acompanharem uma explicação clara da linguagem.
Posso pensar em alguns significados possíveis diferentes, mas não entendo bem qual, se houver algum, eles podem ser:
"Dependente" significa testes multivariados (isto é, muitas variáveis dependentes com preditores iguais ou semelhantes); independente significa testes univariados (ou seja, muitas variáveis independentes, uma variável dependente).
"Dependente" significa testes baseados em assuntos pareados / combinados (por exemplo, teste t pareado, ANOVA de medidas repetidas, etc.); "independente" significa um desenho de estudo de amostras não emparelhado / independente.
"Dependente" significa que a probabilidade de um teste ser rejeitado está correlacionada com a probabilidade de outro teste ser rejeitado e "dependência positiva" significa que essa correlação é positiva; "independente" significa probabilidades de rejeição não correlacionadas.
Referências
Benjamini, Y. e Hochberg, Y. (1995). Controlando a taxa de falsas descobertas: uma abordagem prática e poderosa para testes múltiplos . Jornal da Sociedade Estatística Real. Série B (Metodológica) , 57 (1): 289–300.
Benjamini, Y. e Yekutieli, D. (2001). O controle da taxa de descoberta falsa em vários testes sob dependência . Annals of Statistics , 29 (4): 1165-1188.
Holm, S. (1979). Um procedimento de teste múltiplo sequencialmente rejeitador . Scandinavian Journal of Statistics , 6 (65-70): 1979.
fonte
Respostas:
(A ANOVA lida com esse problema por meio de seu teste F geral. É uma espécie de comparação "para governar todos": não confiaremos na comparação de grupo para grupo, a menos que primeiro esse teste F seja significativo.)
Distribuições conjuntas de variáveis aleatórias independentes são fáceis de calcular. A literatura, portanto, distingue entre essa situação e o caso da não independência.
Consequentemente, o significado correto de "independente" nas citações está no sentido estatístico usual de variáveis aleatórias independentes.
fonte