A taxa de erro do tipo I é igual a alfa ou, no máximo, alfa?

8

De acordo com a página da Wikipedia de valor-p :

Quando o valor p é calculado corretamente, este teste garante que a taxa de erro do tipo I seja no máximo α .

No entanto, mais abaixo na página, esta fórmula é fornecida:

Pr(RejectH|H)=Pr(pα|H)=α

Assumindo 'taxa de erro do tipo 1' = Pr(RejectH|H) isso sugere que a taxa de erro do tipo 1 é α e não 'no máximo α '. Caso contrário, a fórmula seria:

Pr(RejectH|H)α

Onde está meu mal-entendido?

ovo
fonte

Respostas:

8

Quando a "hipótese nula" inclui mais de um estado da natureza, a taxa de falsos positivos reais (FPR) pode variar com esse estado. Tudo o que podemos fazer é garantir um limite para a RPF, não importa qual seja esse estado da natureza - mas nem sempre podemos garantir que a RPF seja realmente igual a .α

(Há outras razões pelas quais o FPR pode não ser realmente igual ao seu valor-alvo , como quando a estatística do teste é discreta. Essas situações geralmente podem ser curadas usando procedimentos de decisão aleatórios. Como tal, eles não fornecem nenhuma percepção fundamental sobre o questão.)α


Considere o teste monocaudal clássico, em que se supõe que a estatística tenha uma distribuição Normal de média desconhecida e (por simplicidade) desvio padrão conhecido . deve ser comparado aμ σ μ 0 H 0 : μ 0 H A : μ < 0Xμσμ0 . A hipótese nula é enquanto a hipótese alternativa é . A região de rejeição é, portanto, da formaH0:μ0HA:μ<0

R(α)=(,Zα]

onde αZα é escolhido para que a chance de observar uma estatística nessa região seja no máximo :α

(1)α=sup(Pr(XR(α))).

Sob as premissas, essa probabilidade é dada pela função de distribuição Normal :Φ

(2)Pr(XR(α))=Φ(Zαμσ).

Essa probabilidade depende do valor desconhecido de . μ Portanto, não podemos garantir que seja realmente igual a . De fato, para grandes , é praticamente zero. Porém, precisamos cobrir todas as nossas bases e garantir que, enquanto for consistente com a hipótese nula, a taxa de falsos positivos não excederá . μ ( 2 ) μ ( 1 ) ααμ(2)μ(1)α

whuber
fonte
1
@ JackPierce-Brown A fórmula está correta para a hipótese nula de ponto e para a estatística de teste contínuo. É o que deve ser assumido no artigo da Wikipedia, mas provavelmente não está explicitado. (+1)
ameba
1
@Amoeba está certo. Observe, além disso, que apenas alguns testes práticos realmente envolvem hipóteses nulas de ponto. Mesmo o teste t de Student clássico de vs não é um ponto Nulo, porque existem várias possibilidades para o valor desconhecido do parâmetro mesmo que o valor nulo fixe o valor de . H A : μ > 0 σ μH0:μ=0 HA:μ>0σμ
whuber
1
@ whuber Hmm, seu exemplo de teste t é intrigante. Você pode elaborar? Eu pensei que é um ponto nulo, porque é um ponto e não insere a hipótese nula. Se é não um nulo ponto, isso significa que a taxa de erro tipo I não é igual a ? Eu teria pensado que deveria ser igual a não importa o que seja . 0 σ α α σH0=00σαασ
Ameba
2
O @Amoeba faz parte da hipótese nula. Rigorosamente, o espaço do parâmetro éA hipótese nula é o subconjuntoNão é um único estado da natureza. Mas talvez este não é o melhor exemplo possível, porque a distribuição do estatística não depende : que é por isso que a FPR constante é possível. q = { ( μ , σ ) | μ R ,σH 0 = { ( μ , σ ) | μ = 0 , σ 0 } q . t σ
Θ={(μ,σ)μR,σ0}.
H0={(μ,σ)μ=0,σ0}Θ.
tσ
whuber
1
Interessante. Eu vejo.
Ameba
4

É uma questão sorrateira. Se você tiver dados contínuos e tratá-los adequadamente, . No entanto, quando seus dados são discretos, pode não ser possível para . Considere dados binomiais sobre se uma moeda é justa, com 5 lançamentos de moeda, os possíveis valores p unilaterais são: p = αPr(pα|H0)=αp=α

> pbinom(0:5, size=5, prob=.5)
[1] 0.03125 0.18750 0.50000 0.81250 0.96875 1.00000

Somente cabeças poderiam gerar um erro do tipo I, e a probabilidade associada a isso é . Portanto, a taxa de erro do tipo I seria mantida em "no máximo ", mas não igual a0,0300.03α α .

Por outro lado, existem estratégias de análise (inválidas) que levam a taxas de erro do tipo I maiores que , mesmo quandoαp<α (por exemplo, rotinas de seleção gradual).

Eu tenho uma discussão mais completa aqui: Comparação e contraste, valores-p, níveis de significância e erro tipo I

- Reinstate Monica
fonte