Considere um modelo com um parâmetro de interesse, , e seu estimador de pontos, . Para simplificar, suponha (em vários casos, isso pode ser justificado assintoticamente). Existem duas maneiras de construir um intervalo que passa a ser o menor intervalo de confiança possível .
Para qualquer valor verdadeiro , quero o menor intervalo possível que tenha probabilidade de capturar . Eu seleciono a região de maior densidade na distribuição de dada , , de modo que a probabilidade cumulativa para essa região seja . Defino o estimador de intervalo de modo que, para cada estimativa de ponto na região, a estimativa de intervalo correspondente cubra . Como a distribuição de é a mesma para qualquer valor verdadeiro
exceto por uma mudança de local, o mecanismo (a regra) para construir o intervalo é independente do que é real . Portanto, cobrirá qualquer verdadeiro com probabilidade .Dada uma estimativa pontual , estou considerando sob qual valor verdadeiro é provável que ele tenha sido gerado. Conhecendo a distribuição de para qualquer dado verdadeiro, , Eu seleciono aqueles s que produzem os mais altos valores de densidade. Limito a seleção a incluir apenas
valores que têm probabilidade cumulativa para valores pelo menos tão extremos quanto ; em outras palavras, ovalores para o qual o correspondente -valor associado a é pelo menos .
A primeira abordagem se concentra diretamente em garantir que, seja qual for o verdadeiro , está incluído no parcela de instâncias de amostragem. A segunda abordagem procura o melhor candidatos que fazem a realização provável, ao descartar s sob os quais é improvável. A linha entre os dois (provável vs. improvável) é traçada de maneira arbitrária da perspectiva do objetivo original, mas passa a ser a linha correta.
As duas regras para construir um intervalo fornecem a mesma resposta neste exemplo simplificado.
Qual (se algum dos dois) é a motivação correta para, ou a maneira correta de pensar, a construção de um intervalo de confiança?
(Talvez remover a suposição distributiva para acima invalidaria uma das abordagens, deixando claro que geralmente é inapropriada e apenas fornece a resposta correta neste exemplo por coincidência?)
fonte
Respostas:
Exemplo com 100 ensaios de Bernoulli
A construção de intervalos de confiança pode ser colocada em um gráfico deθ versus θ^ como aqui:
Podemos rejeitar uma hipótese nula com intervalos de confiança produzidos por amostragem, em vez da hipótese nula?
Na minha resposta a essa pergunta, uso o seguinte gráfico:
Observe que esta imagem é um clássico e uma adaptação de O uso da confiança ou limites fiduciais ilustrados no caso do Binomial CJ Clopper e ES Pearson Biometrika vol. 26, n. 4 (dezembro de 1934), pp. 404-413
Você pode definir umα -% de região de confiança de duas maneiras:
na direção verticalL ( θ ) < X< U( θ ) a probabilidade para os dados X , condicional ao fato de o parâmetro ser verdadeiramente θ , cair dentro desses limites é α .
na direção horizontalL ( X) < θ < U( X) a probabilidade de um experimento ter o parâmetro true dentro do intervalo de confiança é α %
Correspondência entre duas direções
Portanto, o ponto chave é que existe uma correspondência entre os intervalosL ( X) , U( X) e os intervalos L ( θ ) , U( θ ) . É daí que os dois métodos vêm.
Quando você quiserL ( X) e você( X) estar o mais próximo possível ( "o mais curto possível (1 - α ) nível de confiança " ), então você está tentando tornar a área de toda a região o menor possível, e isso é semelhante a obterL ( θ ) e você( θ ) o mais perto possível. (mais ou menos, não há uma maneira única de obter o menor intervalo possível, por exemplo, você pode torná-lo mais curto para um tipo de observaçãoθ^ à custa de outro tipo de observação θ^ )
Exemplo comθ^∼ N( μ = θ ,σ2= 1 +θ2/ 3)
Para ilustrar a diferença entre o primeiro e segundo método que ajustar o exemplo um pouco de tal modo que temos um caso em que os dois métodos de fazer divergir.
Deixe oσ não seja constante, mas sim tenha alguma relação com μ = θ θ^∼ N( μ = θ ,σ2= 1 +θ2/ 3)
então a função densidade de probabilidade paraθ^ , condicional em θ é f(θ^, θ ) =1 12 π( 1 +θ2/ 3)----------√e x p [- ( θ -θ^)22 ( 1 +θ2/ 3)]
Imagine esta função de densidade de probabilidadef(θ^, θ ) plotado em função de θ e θ^ .
Legenda: A linha vermelha é o limite superior do intervalo de confiança e a linha verde é o limite inferior do intervalo de confiança. O intervalo de confiança é desenhado para± 1 σ (aproximadamente 68,3%). As linhas pretas grossas são o pdf (2 vezes) e a função de probabilidade que se cruzam nos pontos( θ ,θ^) = ( - 3 , - 1 ) e ( θ ,θ^) = ( 0 , - 1 ) .
PDF Na direção da esquerda para a direita (constanteθ ) temos o pdf para a observação θ^ dado θ . Você vê dois deles projetados (no planoθ = 7 ) Observe que op limites de valores (p < 1 - α escolhido como a região de maior densidade) estão na mesma altura para um único pdf, mas não na mesma altura para diferentes PDFs (por altura, o valor de f(θ^, θ ) )
Função de probabilidade Na direção de cima para baixo (constanteθ^ ) temos a função de probabilidade para θ dada a observação θ^ . Você vê um desses projetado à direita.
Nesse caso específico, quando você seleciona a massa de 68% com a maior densidade para constantesθ então você não obtém o mesmo que selecionar a massa de 68% com a maior probabilidade de constanteθ^ .
Para outras porcentagens do intervalo de confiança, você terá um ou ambos os limites em± ∞ e também o intervalo pode consistir em duas partes separadas. Portanto, obviamente não é aí que está a maior densidade da função de probabilidade (método 2). Este é um exemplo bastante artificial (embora seja simples e agradável como resulta nesses muitos detalhes), mas também para casos mais comuns, você obtém facilmente que os dois métodos não coincidem (veja o exemplo aqui em que o intervalo de confiança e o intervalo credível com um flat anterior são comparados para o parâmetro rate de uma distribuição exponencial).
Quando os dois métodos são os mesmos?
Essa horizontal versus vertical está dando o mesmo resultado, quando os limitesvocê e eu , que limitavam os intervalos no gráfico θ vs θ^ são iso-linhas para f(θ^; θ ) . Se os limites estiverem em toda parte na mesma altura que em nenhuma das duas direções, você poderá fazer uma melhoria.
(contrastando com isso: no exemplo comθ^∼ N( θ , 1 +θ2/ 3) os limites do intervalo de confiança não terão o mesmo valorf(θ^, θ ) para diferentes θ , porque a massa de probabilidade se torna mais espalhada, portanto, menor densidade, para maior | q | . Isso faz com queθl O w e θh i gh não terá o mesmo valor f(θ^; θ ) , pelo menos para alguns θ^ , Isso contradiz o método 2, que busca selecionar as densidades mais altas f(θ^; θ ) para um dado θ^ . Na imagem acima, tentei enfatizar isso plotando as duas funções pdf relacionadas aos limites do intervalo de confiança no valorθ^= - 1 ; você pode ver que eles têm valores diferentes do pdf nesses limites.)
Na verdade, o segundo método não parece totalmente correto (é mais uma espécie de variação de um intervalo de probabilidade ou um intervalo credível do que um intervalo de confiança) e quando você selecionaα % de densidade na direção horizontal (limite α % da massa da função de probabilidade), então você pode depender das probabilidades anteriores .
No exemplo com a distribuição normal, não há problema e os dois métodos estão alinhados. Para uma ilustração, veja também esta resposta de Christoph Hanck . Lá, os limites são iso-linhas. Quando você muda oθ a função f(θ^, θ ) só faz uma mudança e não muda 'forma'.
Probabilidade fiducial
O intervalo de confiança, quando os limites são criados na direção vertical, são independentes das probabilidades anteriores. Este não é o caso do segundo método.
Essa diferença entre o primeiro e o segundo método pode ser um bom exemplo da diferença sutil entre probabilidade fiducial e intervalos de confiança.
fonte