As probabilidades de erros do tipo I e II estão negativamente correlacionadas?

11

Em uma aula de estatística elementar para a qual eu era AT, o professor afirmou que, à medida que a probabilidade de um erro do tipo I aumenta, a probabilidade de um erro do tipo II diminui, e o inverso também é verdadeiro. Então, isso sugere para mim que .αβρα,β<0

Mas como provar isso para um teste de hipótese geral? A afirmação é mesmo verdadeira em geral?

Eu poderia tentar um caso específico (digamos e ), mas obviamente isso não é geral o suficiente para lidar com essa questão.H0:μ=μ0H1:μ<μ0

Clarinetist
fonte

Respostas:

13

Essas quantidades ( e ) não são variáveis ​​aleatórias, por isso hesito em falar da correlação de Pearson; Não sei em que sentido isso se aplicaria.αβ

Os dois estão relacionados negativamente no sentido de que, razoavelmente falando em geral (mas veja abaixo *) - e mantendo outras coisas (como tamanho da amostra e tamanho do efeito em que você calcula ) iguais - se você alterar , então moverá a direção oposta (especificamente, em situações típicas, é uma função de ; especifique quantidades suficientes para determinar e dependerá de - e esse relacionamento, nas situações mais razoáveis ​​- do tipo que você gostaria de usar em um teste real - seja negativamente dependente).βαββαβα

Considere, por exemplo, alguma curva de potência. Mover empurrará a curva de potência ( ) para cima ou para baixo com ela, então em algum ponto da curva (que é a distância entre a curva e 1) diminui à medida que aumenta. Aqui está um exemplo com um teste bicaudal (digamos, um teste t).α1ββα

insira a descrição da imagem aqui

O caso de uma cauda é semelhante, mas você focaria na metade direita da imagem acima (as duas curvas na metade esquerda da imagem se reduziriam para zero)


* Existem algumas situações em que isso não precisa ser o caso. Considere testar um uniforme (0,1) através de um teste de Kolmogorov-Smirnov.

Vamos considerar a possibilidade de que, em vez disso, tenhamos um uniforme em (ou de fato, qualquer distribuição com alguma probabilidade fora do intervalo unitário).(0,1+ϵ)

Se eu observar um valor que não esteja em (0,1), o teste de Kolmogorov-Smirnov não rejeita necessariamente o nulo. Mas eu posso fazer um segundo teste (vamos chamá-lo de KS *), que é como o Kolmogorov-Smirnov, exceto que, quando observamos um valor fora de (0,1), também rejeitamos o nulo, independentemente da estatística usual atinge o valor crítico.

Então, para qualquer alternativa que tenha qualquer probabilidade externa (0,1), reduzimos a taxa de erro do Tipo II (daquela para o teste KS comum) sem alterar .α

(normalmente não é uma boa ideia usar um KS nesse caso, portanto, se você souber que é uma possibilidade, precisará pensar cuidadosamente em alternativas)

Glen_b -Reinstate Monica
fonte
3

Seja denotado a observação com densidade ou conforme a hipótese ou é verdadeira. Let e denotam as regiões de decisão . Assim, , e a decisão é que seja verdadeiro se . Então, as probabilidades de erro Tipo I e Tipo II são Xf0(x)f1(x)H0H1Γ0Γ1Γ0Γ1=Γ0Γ1=RHiXΓi

(1)P(Type I error)=Γ1f0(x)dx(2)P(Type II error)=Γ0f1(x)dx.
Considere duas outras regiões de decisão e tais que e . Agora, pois a integral está em um conjunto maior, o que significa que o nova regra de decisão tem uma maior probabilidade de erro do tipo I. Mas observe também que porque a integral está em um conjunto menor e, portanto, a nova regra de decisão tem uma menor probabilidade de erro do tipo II.Γ0Γ1Γ1Γ1Γ0Γ0Γ 0 f 1 ( x )
Γ1f0(x)dxΓ1f0(x)dx
Γ0f1(x)dxΓ0f1(x)dx
Dilip Sarwate
fonte
1

O relacionamento que você está vendo entre e é verdadeiro com relação à atividade na qual eles pretendiam estar pensando no momento: ajustando o valor crítico usado para aceitar ou rejeitar uma hipótese. Se você dificulta a obtenção de um falso positivo, naturalmente precisa facilitar a obtenção de um falso negativo. Este site mostra graficamente a relação entre e .β α βαβαβ

O relacionamento não é verdadeiro para todas as atividades. Como um exemplo óbvio, se você aumentar o número de amostras em seu teste, poderá diminuir e simultaneamente. O relacionamento é garantido apenas para quando você estiver ajustando valores críticosβαβ

Cort Ammon
fonte
1
"O relacionamento é apenas" - parece que o final da sua resposta foi cortado?
Silverfish