No famoso experimento de Fisher o observável é o número de copo corrigido imaginado tendo dois tipo de copo e . Geralmente é interessante calcular a região crítica para rejeitar a hipótese nula (a dama está adivinhando aleatoriamente), dado o tamanho do teste . Isso é feito facilmente usando a distribuição hipergeométrica. Da mesma maneira, posso calcular o tamanho do teste, dada a região crítica.
Uma pergunta diferente é: como calcular o poder do teste, dada uma hipótese alternativa? Suponha, por exemplo, que a dama seja capaz de adivinhar corretamente com probabilidade no copo único ( ). Qual é o poder do teste, assumindo um número total de xícaras igual a e um número total de xícaras de um tipo ? (Infelizmente) a senhora sabe .
Dito em outras palavras: qual é a distribuição de (número de xícaras corretas sob a hipótese alternativa) se a senhora souber que há xícaras de um tipo?
fonte
Respostas:
Sob a alternativa, a dama não está adivinhando aleatoriamente, mas "não adivinhando aleatoriamente" abrange uma infinidade de situações diferentes. Ela pode sempre adivinhar com perfeição ou pode fazer apenas um pouco melhor do que a adivinhação aleatória ... e, no caso geral, não há sequer uma "escala" de variável única não aleatória para trabalhar (para que nem tenhamos um poder curva, a menos que restringamos os tipos de respostas não aleatórias que ela pode dar).
Portanto, para calcular um poder, precisamos ser muito específicos sobre como ele não é aleatório (e quão não aleatório é dessa maneira específica).
Podemos supor, por exemplo, que ela tenha uma sensação de quanto cada copo tem gosto de leite foi adicionado primeiro - um índice de "leite primitivo", que é uma variável aleatória em que possui um média diferente (mais alta) quando o leite é adicionado primeiro - por exemplo, podemos supor que seja normal ou logoístico, com média e variação ( é conhecido como " precisão ") quando o leite é adicionado por último e a média e a variação quando o leite é adicionado primeiro (de fato, uma presunção mais simples, porém mais restritiva pode ser definir, digamos,(−∞,∞) μ0 σ2=1/ω2 ω2 μ1 σ2 μ1=−μ0=1 para que tudo agora seja função de uma variável, a precisão). Portanto, para qualquer dado valor desses parâmetros, poderíamos calcular a probabilidade de que ela consiga todas as 8 xícaras corretas (que os quatro menores valores de "primeiridade do leite" que ela experimenta estejam associados às quatro xícaras de segundo de leite); se o cálculo exato fosse muito difícil para nós, poderíamos simulá-lo com a precisão desejada. [No caso em que se presume que a não aleatoriedade é função de apenas uma variável, teríamos uma curva de potência - um valor de potência para cada valor do parâmetro.]
Esse é um tipo específico de modelo de como ela pode ter um desempenho "melhor que aleatório" com o qual podemos especificar parâmetros e obter um valor para o poder.
É claro que poderíamos supor muitas outras formas de não aleatoriedade além desta.
fonte
A distribuição do número correto de palpites sob a hipótese alternativa segue uma distribuição hipergeométrica não central , que é parametrizada em termos de razão de chances, ou seja, quanto maior são as chances de a mulher adivinhar "o chá primeiro" quando chá de fato foi realmente adicionado primeiro em vez de quando de fato o leite foi adicionado primeiro (ou o contrário). Se o odds ratio for 1, obtemos a distribuição hipergeométrica central.
Vamos ver se isso funciona. Usarei R para fins de ilustração, usando o
MCMCpack
pacote, que tem funçãodnoncenhypergeom()
para calcular a densidade de uma distribuição hipergeométrica (não central). Ele tem argumentosx
para o número correto de suposições (cuidado: este é o número correto de suposições sob uma das duas condições, por exemplo, quando o chá foi realmente adicionado primeiro), argumentosn1
,n2
em1
para três das quatro margens, epsi
para o verdadeiro odds ratio. Vamos calcular a densidade parax
igual a 0 a 4 (com todas as margens iguais a 4) quando a taxa de chance real for 1:Isso produz:
Portanto, existe uma chance de 1,43% de que a mulher faça 8 suposições corretas (ou seja, ela adivinha todas as 4 xícaras corretamente onde o chá foi adicionado primeiro e, portanto, ela também adivinha todas as 4 xícaras corretamente onde o leite foi adicionado primeiro) sob a hipótese nula. Essa é de fato a quantidade de evidências que Fisher considerou suficiente para rejeitar a hipótese nula.
As probabilidades especificadas na pergunta podem ser usadas para calcular a razão de chances, a saber, (ou seja, ). Quais são as chances agora que a senhora adivinhe todas as 8 xícaras corretamente (ou seja, ela adivinhe todas as 4 xícaras corretamente onde o chá foi adicionado primeiro e, portanto, também as 4 xícaras corretamente onde o leite foi adicionado primeiro)?(.90/(1−.90))/(.10/(1−.10))=81 odds(guessA|trueA)/odds(guessA|trueB)
Isso produz:
Então o poder é de cerca de 83% então.
fonte