Poder da senhora degustação de chá experiência

9

No famoso experimento de Fisher o observável é o número de copo corrigido imaginado tendo dois tipo de copo e . Geralmente é interessante calcular a região crítica para rejeitar a hipótese nula (a dama está adivinhando aleatoriamente), dado o tamanho do teste . Isso é feito facilmente usando a distribuição hipergeométrica. Da mesma maneira, posso calcular o tamanho do teste, dada a região crítica.kABα

Uma pergunta diferente é: como calcular o poder do teste, dada uma hipótese alternativa? Suponha, por exemplo, que a dama seja capaz de adivinhar corretamente com probabilidade no copo único ( ). Qual é o poder do teste, assumindo um número total de xícaras igual a e um número total de xícaras de um tipo ? (Infelizmente) a senhora sabe .p=90%P(guessA|trueA)=P(guess B|true B)=0.9N=8n=N/2=4n

Dito em outras palavras: qual é a distribuição de (número de xícaras corretas sob a hipótese alternativa) se a senhora souber que há xícaras de um tipo?k=n

Ruggero Turra
fonte
Pensando em sua postagem ... Se Fisher decidisse rejeitar o nulo somente se a mulher estivesse certa em todas as suas suposições (acho que esse era o caso), e só houvesse uma maneira possível de acertar todas as xícaras, a probabilidade de isso acontecer ser ser a potência real? 0.94=0.6561
Antoni Parellada
Você não rejeita quando ela adivinha todos os copos em geral. Mas é verdade que com essa é a região crítica. Você não está levando em consideração que a senhora sabe que existem 4 xícaras de cada tipo. A propósito, eu estou interessado na solução geralN=8N8
Ruggero Turra 21/04
11
Este é um problema interessante, mas difícil. É fácil determinar as tabelas que levariam à rejeição de Ho, mas teria que pensar na probabilidade de vê-las sob Ha. O artigo a seguir calcula o poder de uma tabela ligeiramente modificada com uma certa sensibilidade e especificidade: "Uma generalização do procedimento do chá de degustação de mulheres para vincular abordagens qualitativas e quantitativas na pesquisa psiquiátrica" ​​por Falissard et al. Não tenho certeza se os cálculos estão corretos. Se você realmente tem um problema binomial, então você pode usar o pacote de R exacta, mas isso é um problema diferente perguntou
Peter Calhoun

Respostas:

3

Sob a alternativa, a dama não está adivinhando aleatoriamente, mas "não adivinhando aleatoriamente" abrange uma infinidade de situações diferentes. Ela pode sempre adivinhar com perfeição ou pode fazer apenas um pouco melhor do que a adivinhação aleatória ... e, no caso geral, não há sequer uma "escala" de variável única não aleatória para trabalhar (para que nem tenhamos um poder curva, a menos que restringamos os tipos de respostas não aleatórias que ela pode dar).

Portanto, para calcular um poder, precisamos ser muito específicos sobre como ele não é aleatório (e quão não aleatório é dessa maneira específica).

Podemos supor, por exemplo, que ela tenha uma sensação de quanto cada copo tem gosto de leite foi adicionado primeiro - um índice de "leite primitivo", que é uma variável aleatória em que possui um média diferente (mais alta) quando o leite é adicionado primeiro - por exemplo, podemos supor que seja normal ou logoístico, com média e variação ( é conhecido como " precisão ") quando o leite é adicionado por último e a média e a variação quando o leite é adicionado primeiro (de fato, uma presunção mais simples, porém mais restritiva pode ser definir, digamos,(,)μ0σ2=1/ω2ω2μ1σ2μ1=μ0=1para que tudo agora seja função de uma variável, a precisão). Portanto, para qualquer dado valor desses parâmetros, poderíamos calcular a probabilidade de que ela consiga todas as 8 xícaras corretas (que os quatro menores valores de "primeiridade do leite" que ela experimenta estejam associados às quatro xícaras de segundo de leite); se o cálculo exato fosse muito difícil para nós, poderíamos simulá-lo com a precisão desejada. [No caso em que se presume que a não aleatoriedade é função de apenas uma variável, teríamos uma curva de potência - um valor de potência para cada valor do parâmetro.]

Esse é um tipo específico de modelo de como ela pode ter um desempenho "melhor que aleatório" com o qual podemos especificar parâmetros e obter um valor para o poder.

É claro que poderíamos supor muitas outras formas de não aleatoriedade além desta.

Glen_b -Reinstate Monica
fonte
3

A distribuição do número correto de palpites sob a hipótese alternativa segue uma distribuição hipergeométrica não central , que é parametrizada em termos de razão de chances, ou seja, quanto maior são as chances de a mulher adivinhar "o chá primeiro" quando chá de fato foi realmente adicionado primeiro em vez de quando de fato o leite foi adicionado primeiro (ou o contrário). Se o odds ratio for 1, obtemos a distribuição hipergeométrica central.

Vamos ver se isso funciona. Usarei R para fins de ilustração, usando o MCMCpackpacote, que tem função dnoncenhypergeom()para calcular a densidade de uma distribuição hipergeométrica (não central). Ele tem argumentos xpara o número correto de suposições (cuidado: este é o número correto de suposições sob uma das duas condições, por exemplo, quando o chá foi realmente adicionado primeiro), argumentos n1, n2e m1para três das quatro margens, e psipara o verdadeiro odds ratio. Vamos calcular a densidade para xigual a 0 a 4 (com todas as margens iguais a 4) quando a taxa de chance real for 1:

install.packages("MCMCpack")
library(MCMCpack)
sapply(0:4, function(x) dnoncenhypergeom(x, n1=4, n2=4, m1=4, psi=1))

Isso produz:

[1] 0.01428571 0.22857143 0.51428571 0.22857143 0.01428571

Portanto, existe uma chance de 1,43% de que a mulher faça 8 suposições corretas (ou seja, ela adivinha todas as 4 xícaras corretamente onde o chá foi adicionado primeiro e, portanto, ela também adivinha todas as 4 xícaras corretamente onde o leite foi adicionado primeiro) sob a hipótese nula. Essa é de fato a quantidade de evidências que Fisher considerou suficiente para rejeitar a hipótese nula.

As probabilidades especificadas na pergunta podem ser usadas para calcular a razão de chances, a saber, (ou seja, ). Quais são as chances agora que a senhora adivinhe todas as 8 xícaras corretamente (ou seja, ela adivinhe todas as 4 xícaras corretamente onde o chá foi adicionado primeiro e, portanto, também as 4 xícaras corretamente onde o leite foi adicionado primeiro)?(.90/(1.90))/(.10/(1.10))=81odds(guessA|trueA)/odds(guessA|trueB)

dnoncenhypergeom(4, n1=4, n2=4, m1=4, psi=81)

Isso produz:

[1] 0.8312221

Então o poder é de cerca de 83% então.

Wolfgang
fonte