Ao ler o livro All of Statistics, de Wassermann, noto uma sutileza na definição de valores-p, da qual não consigo entender. Informalmente, o Wassermann define o valor-p como
[..] a probabilidade (em ) de observar um valor da estatística de teste igual ou mais extremo do que o que foi realmente observado.
Enfase adicionada. O mesmo mais formalmente (Teorema 10.12):
Suponha que o teste de tamanho tenha a forma
rejeite se e somente se .
Então,
onde é o valor observado de . Se então
Além disso, Wassermann define o valor p do teste Pearson (e outros testes analogamente) como:
A parte que eu gostaria de pedir esclarecimentos é o sinal de maior-igual ( ) no primeiro e o maior ( ) na segunda definição. Por que não escrevemos , que corresponderia à primeira citação de " igual ou mais extremo"?
É pura conveniência para calcularmos o valor de p como ? Percebo que R também usa a definição com o sinal , por exemplo, em .chisq.test
Respostas:
"Como ou mais extremo" está correto.
Formalmente, então, se a distribuição é tal que a probabilidade de obter a própria estatística de teste é positiva, essa probabilidade (e qualquer coisa igualmente extrema, como o valor correspondente na outra cauda) deve ser incluída no valor p.
Obviamente, com uma estatística contínua, essa probabilidade de igualdade exata é 0. Não faz diferença se dissermos ou .> ≥
fonte
O primeiro ponto de é que o espaço de hipóteses é topologicamente fechado dentro de todo o espaço de parâmetros. Sem considerar a aleatoriedade, isso pode ser uma convenção útil se você tiver alguma afirmação sobre uma sequência convergente de parâmetros pertencentes à hipótese, porque você saberia que o limite não pertence repentinamente à alternativa.≥
Agora, considerando as distribuições de probabilidade, elas são (geralmente) contínuas à direita. Isso significa que o mapeamento do espaço de hipótese fechado para o intervalo é fechado novamente. É por isso que os intervalos de confiança também são fechados por convenção.[0,1]
Isso aprimora a matemática. Imagine que você construa um intervalo de confiança para o parâmetro de localização de uma distribuição de probabilidade assimétrica. Lá, você teria que trocar o comprimento para a cauda superior pelo comprimento para a cauda inferior. A probabilidade em ambas as caudas deve somar . Para que o IC seja o mais informativo possível, é necessário encurtar o comprimento do IC, para que sua probabilidade de cobertura ainda seja . Este é um conjunto fechado. Você pode encontrar uma solução ótima lá por algum algoritmo iterativo, por exemplo, o teorema do ponto fixo de Banach. Se fosse um conjunto aberto, você não pode fazer isso.α ≥1−α
fonte