A derivação do intervalo de previsão para o modelo linear é bastante simples: obter uma fórmula para os limites de previsão em um modelo linear .
Como derivar os intervalos de confiança e previsão para os valores ajustados das regressões logit e probit (e GLMs em geral)?
Respostas:
No GLM, a previsão é uma função não linear do produto das covariáveis com vetor de coeficiente estimado : Distribuição por amostra finita de é geralmente desconhecido, mas desde que seja uma estimativa de probabilidade máxima , ela possui distribuição normal assintótica , em que é a matriz hessiana da função de probabilidade em seu máximo. Os valores p def X β^
Quando você usa uma distribuição normal assintótica de (e, portanto, ), a distribuição de ainda não é normal devido a não linear . Você pode ignorá-lo - obtenha limites de confiança normais para e conecte-os em , obtendo limites para como .β^ Xβ^ y^ f (zlower,zupper) Xβ f y (ylower,yupper)=(f(zlower),f(zupper))
Outra estratégia (chamada método delta ) é fazer uma expansão de de Taylor em torno de - será linear em . Portanto, você pode aproximar a distribuição de comof Xβ^ β^ f(Xβ^)
Então, o intervalo de confiança assintótico de 95% para pareceriaf(Xβ)
Agora você só precisa encontrar expressão para matrizes Hessianas para modelos específicos, como regressão logística nesta questão . E esta questão apresenta uma comparação prática de bootstrap, limites normais transformados e método delta para regressão logística.
fonte
Quando tudo mais falhar, você sempre poderá criar ICs iniciados por inicialização para qualquer estatística. Aqui está um algoritmo simples:
fonte