Vejo pessoas confundindo isso o tempo todo, também neste fórum. Eu acho que isso é causado em grande parte porque, na prática, o procedimento de Benjamini-Hochberg é usado como sinônimo da Taxa de Descobertas Falsas (e como uma caixa preta para "ajustar" os valores de p, conforme solicitado pelos revisores para seus trabalhos). É preciso separar claramente o conceito de FDR do método de Benjamini-Hochberg. O primeiro é um erro generalizado do tipo I, enquanto o segundo é um procedimento de teste múltiplo que controla esse erro. Isso é muito análogo, por exemplo, ao procedimento de FWER e Bonferroni.
De fato, não há razão imediata para que o número de hipóteses seja importante quando você deseja usar os métodos de controle de FDR. Depende apenas do seu objetivo. Em particular, suponha que você esteja testando hipóteses e seu procedimento rejeite R delas com V rejeições falsas.mRV
FDR R= Pr [ V≥ 1 ]FDRR
FDR=E[VmaxR,1]
Assim, a resposta à sua pergunta depende completamente do que você deseja alcançar e não há uma razão intrínseca para que pequeno seja problemático. Apenas para ilustrar um pouco mais: o exemplo de análise de dados no artigo seminal de Benjamini-Hochberg, de 1995, incluía hipóteses e, é claro, também é válido para esse caso!m = 15mm=15
Obviamente, há uma ressalva na minha resposta: o procedimento BH só ficou popular depois que conjuntos de dados "maciços" (por exemplo, Microarrays) começaram a se tornar disponíveis. E, como você mencionou, é normalmente usado para esse aplicativo "Big Data". Mas isso ocorre apenas porque nesses casos o como critério faz mais sentido, por exemplo, porque é escalável e adaptável e facilita a pesquisa exploratória. O FWER, por outro lado, é muito rigoroso, conforme exigido por estudos clínicos etc., e o pune demais por explorar muitas opções simultaneamente (ou seja, não é adequado para trabalhos exploratórios).FDR
Agora, vamos supor que você tenha decidido que o FDR é o critério apropriado para sua aplicação. Benjamini Hochberg é a escolha certa para controlar o FDR quando o número de hipóteses é baixo? Eu diria que sim, pois é estatisticamente válido também para baixos . Mas para baixo, você poderia, por exemplo, também usar outro procedimento, o procedimento de Benjamini e Liu , que também controla o FDR. De fato, os autores sugerem seu uso (acima de Benjamini-Hochberg) quandom m ≤ 14mmm≤14e a maioria das hipóteses deve ser falsa. Então você vê que existem opções alternativas para o controle de FDR! Na prática, eu ainda usaria BH apenas porque está muito bem estabelecido e porque os benefícios do uso de Benjamini-Liu serão marginais na maioria dos casos, se é que existem.
Em uma nota final relacionada, existem de fato alguns procedimentos de controle de FDR que você não deve usar por ! Isso inclui todos os procedimentos baseados em local-fdr, por exemplo, conforme implementado nos pacotes R "fdrtool" e "locfdr".m