No meu trabalho, vi vários usos do teste exato de Fisher e fiquei imaginando quão bem ele se encaixa nos meus dados. Olhando para várias fontes, entendi como calcular a estatística, mas nunca vi uma explicação clara e formal da hipótese nula assumida.
Alguém pode me explicar ou me encaminhar para uma explicação formal da distribuição assumida? Será grato por uma explicação em termos dos valores na tabela de contingência.
Respostas:
No caso , a suposição distributiva é dada por duas variáveis aleatórias binomiais independentes e . A hipótese nula é a igualdade . Mas o teste exato de Fisher é um teste condicional: ele depende da distribuição condicional de dado . Essa distribuição é uma distribuição hipergeométrica com um parâmetro desconhecido: a razão de chances e depois a hipótese nula é .2×2 X1∼Bin(n1,θ1) X2∼Bin(n2,θ2) θ1=θ2 X1 X1+X2 ψ=θ11−θ1θ21−θ2 ψ=1
Esta distribuição tem sua página da Wikipedia .
Para avaliá-lo com R, você pode simplesmente usar a fórmula que define a probabilidade condicional:
Ou use a
dnoncenhypergeom
função doMCMCpack
pacote:fonte
O chamado teste "exato" de Fisher faz o mesmo tipo de suposições sutis que os fazem.χ2
O teste de Fisher faz uma suposição não feita por testes incondicionais de associação, como o teste Pearson: que estamos interessados na distribuição marginal "atual" de e , ou seja, estamos condicionando as frequências do categorias de resultados. Isso não é razoável para estudos prospectivos. O uso do teste de Fisher leva ao conservadorismo. Seus valores- são, em média, muito grandes, porque o teste garante que os valores- não sejam muito pequenos. Em média, Pearson -Valores são mais acccurate de Fisher, mesmo com frequências esperadas muito menor do que 5 em algumas das células. X Y Y P P χ 2 Pχ2 X Y Y P P χ2 P
fonte