Estou executando testes estatísticos independentes com a mesma hipótese nula e gostaria de combinar os resultados em um valor . Parece que existem dois métodos "aceitos": o método de Fisher e o método de Stouffer .
Minha pergunta é sobre o método de Stouffer. Para cada teste separado, obtenho um z-score . Sob uma hipótese nula, cada um deles é distribuída com uma distribuição normal padrão, de modo que a soma segue uma distribuição normal com variância . Portanto, o método de Stouffer sugere calcular , que deve ser normalmente distribuído com variação de unidade e, em seguida, use-o como um escore z conjunto.
Isso é razoável, mas aqui está outra abordagem que eu criei e que também me parece razoável. Como cada um dos trata de uma distribuição normal padrão, a soma dos quadrados deve vir de uma distribuição do Qui-quadrado com graus de liberdade. Assim, pode-se calcular e convertê-lo em um valor usando a função de distribuição qui-quadrado cumulativa com graus de liberdade ( , onde é o CDF).
No entanto, em nenhum lugar posso encontrar essa abordagem sequer mencionada. É alguma vez usado? Isso tem um nome? Quais seriam as vantagens / desvantagens em comparação com o método de Stouffer? Ou existe uma falha no meu raciocínio?
fonte
Respostas:
Uma falha que salta para fora é o método de Stouffer pode detectar mudanças sistemáticas na , que é o que se costuma esperar que aconteça quando uma alternativa é sempre verdadeira, ao passo que o método qui-quadrado parece ter menos energia para fazê-lo. Uma simulação rápida mostra que esse é o caso; o método qui-quadrado é menos poderoso para detectar uma alternativa unilateral. Aqui estão histogramas dos valores de p pelos dois métodos (vermelho = Stouffer, azul = qui-quadrado) para 10 5 iterações independentes com N = 10 e vários efeitos padronizados unilaterais μ variando de nenhum ( μ = 0 ) a 0,6 DP ( μ =zi 105 N=10 μ μ=0 0.6 ).μ=0.6
O melhor procedimento terá mais área próxima de zero. Para todos os valores positivos de mostrados, esse procedimento é o procedimento Stouffer.μ
Código R
Isso inclui o método de Fisher (comentado) para comparação.
fonte
R
simulação para testar isso. Seria uma boa maneira de se apresentar a essa plataforma de computação estatística. :-)Uma maneira geral de obter informações sobre as estatísticas de teste é derivar as suposições subjacentes (geralmente implícitas) que levariam a estatística de teste a ser mais poderosa. Para esse caso em particular, um estudante e eu fizemos isso recentemente: http://arxiv.org/abs/1111.1210v2 (uma versão revisada deve aparecer em Annals of Applied Statistics).
Para resumir muito brevemente (e consistente com os resultados da simulação em outra resposta) o método de Stouffer será mais poderoso quando os efeitos subjacentes "verdadeiros" forem todos iguais; a soma de Z ^ 2 será mais poderosa quando os efeitos subjacentes são normalmente distribuídos em torno de 0. Essa é uma pequena simplificação que omite detalhes: consulte a seção 2.5 na pré-impressão do arxiv vinculada acima para obter mais detalhes.
fonte
Ligeiramente o / t: um dos problemas de ambas as abordagens é a perda de potência devido aos graus de liberdade (N para Stouffer's; 2N para Fisher). Foram desenvolvidas melhores abordagens meta-analíticas para isso, que você pode considerar (meta-análise ponderada por variância inversa, por exemplo).
Se você está procurando evidências de alguns testes alternativos em um grupo, consulte a estatística de maior crítica de Donoho e Jin: https://projecteuclid.org/euclid.aos/1085408492
fonte
Para responder à pergunta e a outros leitores: ele já foi usado ?, existe um artigo exaustivo de Cousins (2008) sobre o arXiv, que lista e revisa algumas abordagens alternativas. O proposto não parece aparecer.
fonte