(Para tornar nossas noções um pouco mais precisas, vamos chamar de 'estatística de teste' a distribuição da coisa que procuramos para realmente computar o valor p. Isso significa que, para um teste t bicaudal, nossa estatística de teste seria vez de )| T|T
O que uma estatística de teste faz é induzir uma ordem no espaço da amostra (ou mais estritamente, uma ordem parcial), para que você possa identificar os casos extremos (os mais consistentes com a alternativa).
No caso do teste exato de Fisher, já existe uma ordenação em um sentido - quais são as probabilidades das próprias tabelas 2x2. Por acaso, eles correspondem à ordem em no sentido de que os valores maiores ou menores de são 'extremos' e também são os que têm menor probabilidade. Portanto, em vez de examinar os valores de da maneira que você sugere, pode-se simplesmente trabalhar com os extremos grandes e pequenos, a cada passo apenas adicionando qualquer valor (o maior ou o menorX1,1X1,1X1,1X1,1-valor ainda não existente) tem a menor probabilidade associada a ele, continuando até chegar à sua tabela observada; na sua inclusão, a probabilidade total de todas essas tabelas extremas é o valor de p.
Aqui está um exemplo:
> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
x prob rank
1 0 1.871194e-04 2
2 1 5.613581e-03 4
3 2 5.052223e-02 6
4 3 1.886163e-01 8
5 4 3.300786e-01 10
6 5 2.829245e-01 9
7 6 1.178852e-01 7
8 7 2.245433e-02 5
9 8 1.684074e-03 3
10 9 3.402171e-05 1
A primeira coluna é , a segunda coluna são as probabilidades e a terceira coluna é a ordem induzida.X1,1
Portanto, no caso específico do teste exato de Fisher, a probabilidade de cada tabela (equivalentemente, de cada valor ) pode ser considerada a estatística real do testeX1,1 .
Se você comparar sua estatística de teste sugerida, induz a mesma ordem neste caso (e acredito que o faça em geral, mas não marquei), em que valores maiores dessa estatística são os menores da probabilidade; portanto, poderia igualmente ser considerado 'a estatística' - mas também muitas outras quantidades - de fato, todas as que preservam essa ordem dos s em todos os casos são estatísticas de teste equivalentes, porque sempre produzem valores-p idênticos.|X1,1−μ|X1,1
Observe também que, com a noção mais precisa de 'estatística de teste' introduzida no início, nenhuma das estatísticas de teste possíveis para esse problema realmente tem uma distribuição hipergeométrica; sim, mas na verdade não é uma estatística de teste adequada para o teste bicaudal (se fizermos um teste unilateral em que apenas mais associação na diagonal principal e não na segunda diagonal seja considerada consistente com a alternativa, seria uma estatística de teste). Este é apenas o mesmo problema de uma ou duas caudas que eu comecei.X1,1
[Edit: alguns programas apresentam uma estatística de teste para o teste de Fisher; Eu presumo que este seria um cálculo do tipo -2logL que seria assintoticamente comparável a um qui-quadrado. Alguns também podem apresentar o odds ratio ou seu log, mas isso não é bem equivalente.]
u | X 1 , 1 - μ | X 1 , 1|X1,1−μ| não pode ter uma distribuição hipergeométrica em geral porque não precisa ser um valor inteiro e, em seguida,não seria um número inteiro. Mas condicionalmente nas margens, terá uma distribuição hipergeométrica.μ |X1,1−μ| X1,1
Se você fizer isso corretamente e fixar as margens em valores conhecidos, poderá considerar (ou qualquer outra célula) como sua estatística. Com a analogia de desenhar bolas de uma urna contendo bolas brancas e bolas pretas sem substituição, pode ser interpretado como o número de bolas brancas desenhadas, onde é a soma da primeira linha, é a soma da segunda linha, é a soma da primeira coluna. k W B X 1 , 1 B W kX1,1 k W B X1,1 B W k
fonte
Realmente não tem um. As estatísticas de teste são uma anomalia histórica - a única razão pela qual temos uma estatística de teste é obter um valor p. O teste exato de Fisher passa por uma estatística de teste e vai direto para um valor-p.
fonte