Como se pode calcular intervalos de confiança para valores-p e como o oposto da estimativa de intervalo é a estimativa pontual: O valor-p é uma estimativa pontual?
confidence-interval
estimation
p-value
estimators
point-estimation
00schneider
fonte
fonte
Respostas:
As estimativas pontuais e os intervalos de confiança são para parâmetros que descrevem a distribuição, por exemplo, média ou desvio padrão.
Porém, diferentemente de outras estatísticas da amostra, como a média da amostra e o desvio padrão da amostra, o valor p não é um estimador útil de um parâmetro de distribuição interessante. Veja a resposta de @whuber para obter detalhes técnicos.
O valor-p para uma estatística de teste fornece a probabilidade de observar um desvio do valor esperado da estatística de teste tão grande quanto o observado na amostra, calculado sob a suposição de que a hipótese nula é verdadeira. Se você tiver toda a distribuição, ela é consistente com a hipótese nula ou não. Isso pode ser descrito com a variável indicadora (novamente, veja a resposta por @whuber).
Mas o valor p não pode ser usado como um estimador útil da variável do indicador, porque não é consistente, pois o valor p não converge à medida que o tamanho da amostra aumenta se a hipótese nula for verdadeira. Essa é uma maneira alternativa bastante complicada de afirmar que um teste estatístico pode rejeitar ou deixar de rejeitar o nulo, mas nunca o confirma.
fonte
Sim, poderia ser (e tem sido) argumentado que um valor-p é uma estimativa pontual.
Para identificar qualquer propriedade de uma distribuição que um valor-p possa estimar, teríamos que assumir que é assintoticamente imparcial. Mas, assimptoticamente, a p-valor médio para a hipótese nula é (idealmente, para alguns testes que poderia ser algum outro número diferente de zero) e para qualquer outra hipótese é 0 . Assim, o valor-p pode ser considerado um estimador de metade da função do indicador para a hipótese nula.1 / 2 0 0
É certo que é preciso alguma criatividade para visualizar um valor-p dessa maneira. Poderíamos fazer um pouco melhor vendo o estimador em questão como a decisão que tomamos por meio do valor-p: a distribuição subjacente é um membro da hipótese nula ou da hipótese alternativa? Vamos chamar esse conjunto de possíveis decisões . Jack Kiefer escreveD
Nesse caso, como é discreto, "razoavelmente suave" não é uma restrição. A terminologia de Kiefer reflete isso referindo-se a procedimentos estatísticos com espaços de decisão discretos como "testes" em vez de "estimadores pontuais".D
Embora seja interessante explorar os limites (e limitações) de tais definições, como esta pergunta nos convida a fazer, talvez não devamos insistir muito fortemente que um valor-p é um estimador de pontos, porque essa distinção entre estimadores e testes é tanto útil e convencional.
Em um comentário a essa pergunta, Christian Robert chamou a atenção para um artigo de 1992 em que ele e os co-autores adotaram exatamente esse ponto de vista e analisaram a admissibilidade do valor-p como estimador da função do indicador . Veja o link nas referências abaixo. O artigo começa,
[Enfase adicionada.]
Referências
Jiunn Tzon Hwang, George Casella, Christian Robert, Martin T. Wells e Roger H. Farrell, Estimação de precisão em testes . Ann. Statist. Volume 20, Número 1 (1992), 490-509. Acesso aberto .
Jack Carl Kiefer, Introdução à Inferência Estatística . Springer-Verlag, 1987.
fonte
fonte