Eu tenho um conjunto de dados em que testo diferenças significativas entre três populações com relação a cerca de 50 variáveis diferentes. Faço isso usando os testes de Kruskal-Wallis, por um lado, e por testes de razão de verossimilhança do modelo GLM aninhado (por e sem população como uma variável independente), por outro.
Como resultado, tenho uma lista de Kruskal-Wallis -valores por um lado, e o que eu acho que é o quadrado do Chi -valores das comparações LRT, por outro.
Preciso fazer alguma forma de correção de vários testes, pois existem> 50 testes diferentes, e o Benjamini-Hochberg FDR parece ser a escolha mais sensata.
No entanto, as variáveis provavelmente não são independentes, com vários "clãs" deles sendo correlacionados. A questão é então: como posso saber se o conjunto de estatísticas subjacentes para o meu- os valores atendem aos requisitos de dependência positiva necessários para que o procedimento de Benjamini-Hochberg ainda esteja vinculado ao FDR?
O artigo de Benjamini-Hochberg-Yekutieli de 2001 afirma que a condição PRDS é válida para distribuição normal e estudada multivariada. E o meu teste de razão de verossimilhança para os valores do quadrado de Chi para a comparação do modelo? E o-valores que tenho para os testes de Kruskal-Wallis?
Posso usar a correção de FDR de pior caso de Benjamini-Hochberg-Yekutieli que não assume nada na dependência, mas acho que pode ser muito conservadora nesse caso e perder alguns sinais relevantes.
fonte
O PRDS é uma condição suficiente, mas não necessária, para BH controlar o FDR. Eu sugiro que você o use e também use o procedimento Benjamini-Yekutieli para dependência geral. Se a diferença de inferência for grande, tente demonstrar que BH controla o FDR em sua configuração específica usando permutações ou técnicas baseadas em reamostragem que conservam sua estrutura de dependência.
fonte