A definição padrão de (digamos) um intervalo de confiança de 95% (IC) simplesmente requer que a probabilidade de que ele contenha o parâmetro true seja de 95%. Obviamente, isso não é único. A linguagem que eu vi sugere que, entre os muitos IC válidos, geralmente faz sentido encontrar algo como o mais curto, simétrico ou conhecido precisamente mesmo quando alguns parâmetros de distribuição são desconhecidos etc. Em outras palavras, parece não haver hierarquia óbvia do que o IC é "melhor" do que outros.
No entanto, pensei que uma definição equivalente de IC é que ela consiste em todos os valores, de modo que a hipótese nula de que o parâmetro true seja igual a esse valor não seria rejeitada no nível de significância apropriado depois de ver a amostra realizada. Isso sugere que, desde que escolhamos um teste que gostamos, podemos construir automaticamente o IC. E há uma preferência padrão entre testes com base no conceito de UMP (ou UMP entre testes imparciais).
Existe algum benefício em definir o IC como o correspondente ao teste UMP ou algo parecido?
Respostas:
Um pouco longo para um comentário. Confira a discussão sobre as UMPs neste artigo "A falácia de confiar em intervalos de confiança" de Morey et al. Em particular, existem alguns exemplos em que:
fonte
Rejeição é apenas parte da inferência, não fique preso lá. Você está tomando uma decisão. Digamos que você precise decidir se deve ir a um mecânico quando a luz do "mecanismo de verificação" acender ou se esquecer disso.
Não é assim que as decisões devem ser tomadas e como o significado econômico deve ser levado em consideração. Você deve calcular o custo de ir com nulo vs. rejeitá-lo e selecionar a hipo alternativa.
Omiti completamente a hipótese alternativa no exemplo acima, porque é assim que todo mundo faz: eles acham que a hipo alternativa é apenas algum tipo de formalidade como a reverência. Na vida real, a alternativa é tão importante quanto o nulo, porque é assim que você calcula o custo de não escolher o nulo. Somente quando você contabiliza os custos de nulo e alternativo, você deve tomar a decisão de ir ou não a um mecânico. O valor de p e os intervalos de confiança por si só não têm significado nesse sentido, apenas em conjunção com os custos que se tornam significativos
fonte