Quando a "hipótese nula" inclui mais de um estado da natureza, a taxa de falsos positivos reais (FPR) pode variar com esse estado. Tudo o que podemos fazer é garantir um limite para a RPF, não importa qual seja esse estado da natureza - mas nem sempre podemos garantir que a RPF seja realmente igual a .α
(Há outras razões pelas quais o FPR pode não ser realmente igual ao seu valor-alvo , como quando a estatística do teste é discreta. Essas situações geralmente podem ser curadas usando procedimentos de decisão aleatórios. Como tal, eles não fornecem nenhuma percepção fundamental sobre o questão.)α
Considere o teste monocaudal clássico, em que se supõe que a estatística tenha uma distribuição Normal de média desconhecida e (por simplicidade) desvio padrão conhecido . deve ser comparado aμ σ μ 0 H 0 : μ ≥ 0 H A : μ < 0Xμσμ0 . A hipótese nula é enquanto a hipótese alternativa é . A região de rejeição é, portanto, da formaH0:μ≥0HA:μ<0
R(α)=(−∞,Zα]
onde αZα é escolhido para que a chance de observar uma estatística nessa região seja no máximo :α
α=sup(Pr(X∈R(α))).(1)
Sob as premissas, essa probabilidade é dada pela função de distribuição Normal :Φ
Pr(X∈R(α))=Φ(Zα−μσ).(2)
Essa probabilidade depende do valor desconhecido de . μ Portanto, não podemos garantir que seja realmente igual a . De fato, para grandes , é praticamente zero. Porém, precisamos cobrir todas as nossas bases e garantir que, enquanto for consistente com a hipótese nula, a taxa de falsos positivos não excederá . μ ( 2 ) μ ( 1 ) ααμ(2)μ(1)α
É uma questão sorrateira. Se você tiver dados contínuos e tratá-los adequadamente, . No entanto, quando seus dados são discretos, pode não ser possível para . Considere dados binomiais sobre se uma moeda é justa, com 5 lançamentos de moeda, os possíveis valores p unilaterais são: p = αPr(p≤α|H0)=α p=α
Somente cabeças poderiam gerar um erro do tipo I, e a probabilidade associada a isso é . Portanto, a taxa de erro do tipo I seria mantida em "no máximo ", mas não igual a≈ 0,030 ≈0.03 α α .
Por outro lado, existem estratégias de análise (inválidas) que levam a taxas de erro do tipo I maiores que , mesmo quandoα p<α (por exemplo, rotinas de seleção gradual).
Eu tenho uma discussão mais completa aqui: Comparação e contraste, valores-p, níveis de significância e erro tipo I
fonte