Que distribuição assume o teste exato de Fisher?

11

No meu trabalho, vi vários usos do teste exato de Fisher e fiquei imaginando quão bem ele se encaixa nos meus dados. Olhando para várias fontes, entendi como calcular a estatística, mas nunca vi uma explicação clara e formal da hipótese nula assumida.

Alguém pode me explicar ou me encaminhar para uma explicação formal da distribuição assumida? Será grato por uma explicação em termos dos valores na tabela de contingência.

Amit Lavon
fonte
3
No caso 2x2, é baseado na distribuição hipergeométrica.
Glen_b -Reinstala Monica

Respostas:

11

No caso , a suposição distributiva é dada por duas variáveis ​​aleatórias binomiais independentes e . A hipótese nula é a igualdade . Mas o teste exato de Fisher é um teste condicional: ele depende da distribuição condicional de dado . Essa distribuição é uma distribuição hipergeométrica com um parâmetro desconhecido: a razão de chances e depois a hipótese nula é .2×2X1Bin(n1,θ1)X2Bin(n2,θ2)θ1=θ2X1X1+X2ψ=θ11θ1θ21θ2ψ=1

Esta distribuição tem sua página da Wikipedia .

Para avaliá-lo com R, você pode simplesmente usar a fórmula que define a probabilidade condicional:

p1 <- 7/27
p2 <- 14/70
x1 <- 7; n1 <- 27
x2 <- 14; n2 <- 56
# 
m <- x1+x2
dbinom(x1, n1, p1)*dbinom(x2, n2, p2)/sum(dbinom(0:m, n1, p1)*dbinom(m-(0:m), n2, p2))
[1] 0.1818838

Ou use a dnoncenhypergeomfunção do MCMCpackpacote:

psi <- p1/(1-p1)/(p2/(1-p2)) # this is the odds ratio
MCMCpack::dnoncenhypergeom(x=x1, n1, n2, x1+x2, psi)
[1] 0.1818838
Stéphane Laurent
fonte
Obrigado @Stephane. Você pode explicar melhor por que isso se torna hipergeométrico e quais são os parâmetros?
Amit Lavon
2
Desculpe @AmitLavon, não sei os detalhes sobre essa distribuição hipergeométrica.
Stéphane Laurent
11
@AmitLavon Acabei de editar minha resposta para incluir o link para a wikipedia e o código R.
Stéphane Laurent
10

O chamado teste "exato" de Fisher faz o mesmo tipo de suposições sutis que os fazem.χ2

  • As duas variáveis ​​que estão sendo avaliadas quanto à associação são realmente variáveis ​​politômicas do tipo tudo ou nada, como EUA / Europa mortos / vivos. Se uma ou ambas as variáveis ​​são uma simplificação de um continuum subjacente, a análise de dados categóricos não deve ser realizada.
  • Não há outras variáveis ​​relevantes em segundo plano. Se é a variável de resultado e é uma variável que está sendo avaliada para associação com , a probabilidade de é idêntica para todos os sujeitos com fixado em . Tabelas de contingência assumem no sentido de que não há heterogeneidade na distribuição de que não é explicada por . Por exemplo, em um ensaio clínico randomizado estudando o efeito do tratamento A vs. B na probabilidade de morte, aX Y Y = y X x Y X 2 × 2YXYY=yXxYX2×2O teste da tabela de contingência pressupõe que todo sujeito no tratamento A tenha a mesma probabilidade de morte. [Alguém poderia argumentar que isso é uma suposição muito rigorosa, mas essa posição não reconhece a perda de poder de fazer testes de associação não ajustados.]

O teste de Fisher faz uma suposição não feita por testes incondicionais de associação, como o teste Pearson: que estamos interessados ​​na distribuição marginal "atual" de e , ou seja, estamos condicionando as frequências do categorias de resultados. Isso não é razoável para estudos prospectivos. O uso do teste de Fisher leva ao conservadorismo. Seus valores- são, em média, muito grandes, porque o teste garante que os valores- não sejam muito pequenos. Em média, Pearson -Valores são mais acccurate de Fisher, mesmo com frequências esperadas muito menor do que 5 em algumas das células. X Y Y P P χ 2 Pχ2XYYPPχ2 P

Frank Harrell
fonte
Obrigado @FrankHarrell. Você pode fornecer referências para a sua alegação de que os valores P do qui-quadrado são mais precisos que os de Fisher?
Amit Lavon
11
Veja, por exemplo, citeulike.org/user/harrelfe/tag/fishers-exact-test . Isso foi discutido detalhadamente no stackexchange.
Frank Harrell
infelizmente, ctiteulike se foi e o web.archive.org apenas parece ter rastreado a primeira página da conta harrelfe.
Glen_b -Reinstate Monica