No entanto, como também podemos gerar um intervalo de confiança de 95%, como fazemos com testes paramétricos normais?
Aqui está uma maneira você poderia gerar um intervalo de um teste de reamostragem, embora não seja sempre apropriado para considerá-lo um intervalo de confiança . Para um exemplo específico, faça um teste para obter uma diferença de média de duas amostras. Considere mudar a segunda amostra por (que pode ser positiva ou negativa). Então, o conjunto de valores que levaria à não rejeição pelo teste no nível poderia ser usado como um intervalo de confiança nominalmente de para a diferença de médias.†δδα1−α
† Alguns autores (por exemplo, [1], p364 e segs , [2]) chamam um intervalo construído dessa maneira (valores de parâmetros não rejeitados pelo teste) como um intervalo de consonância - que é um nome melhor que o intervalo de confiança para ele (embora muitas pessoas simplesmente ignoram a diferença; por exemplo, acredito que Cox e Hinkley chamam esses intervalos de confiança) porque a abordagem não necessariamente fornece intervalos com a cobertura desejada (em muitas situações é possível ver que deveria); o nome transmite algo sobre o que o intervalo diz (um intervalo de valores consistente com os dados).
Gelman inclui uma discussão sobre por que às vezes pode ser problemático considerá-los universalmente como intervalos de confiança aqui .
No entanto, não é difícil explorar a cobertura sob conjuntos específicos de suposições (via simulação), e não há falta de pessoas chamando os intervalos de autoinicialização de "intervalos de confiança" (mesmo quando às vezes são vistos como tendo a cobertura reivindicada).
Mais detalhes sobre como fazê-lo no caso de diferença de médias de duas amostras são discutidos em [3], onde são chamados intervalos de confiança de randomização e é feita uma reivindicação sobre quando eles são exatos (que afirmam que eu não tenho ' tentei avaliar).
Com 1000 permutações ...., a incerteza próxima de p = 0,05 é de cerca de ± 1%.
Eu me pergunto como conseguimos essa incerteza?
O valor p estimado é uma proporção binomial direta. Portanto, ele possui o mesmo erro padrão que qualquer outra proporção binomial, .p(1−p)n−−−−−√
Portanto, se e , o erro padrão da proporção observada é de cerca de . Um IC de seria [como alternativa, é cerca de erros padrão de cada lado, o que corresponderia a um intervalo de confiança para o valor p subjacente de um pouco mais de ]p=0.05n=10000.006990%±1.13%±1%1.4585%
Então, pelo menos em um sentido aproximado, você poderia falar sobre a incerteza ser "cerca de 1%"
-
[1] Kempthorne e Folks (1971),
Probabilidade, Estatística e análise de dados ,
Iowa State University Press
[2] LaMotte LR e Volaufová J, (1999),
"Intervalos de Predição por Intervalos de Consonância",
Journal of the Royal Statistical Society. Série D (Estatístico) , vol. 48, No. 3, pp. 419-424
[3] Ernst, MD (2004),
"Métodos de Permutação: Uma Base para Inferência Exata",
Statistical Science , vol. 19, nº 4, 676-685