Suponha que tenhamos um modelo de regressão logística:
Dada uma amostra aleatória de tamanho , podemos calcular intervalos de confiança para o e intervalos de previsão correspondentes para , dado um determinado valor do vetor preditor. Tudo isso é muito padrão e detalhado, por exemplo, aqui .
Suponha, em vez disso, que eu esteja interessado em um intervalo de previsão para , dado . Obviamente, não faz nenhum sentido computar um intervalo de previsão para uma única realização de , porque só pode assumir os valores 0 e 1, e nenhum valor entre eles. No entanto , se considerarmos realizações de para o mesmo valor fixo de , isso se tornará semelhante (mas não idêntico) à questão de calcular um intervalo de previsão para uma variável aleatória binomial . Esta é basicamente a mesma situação descrita por Glen_b nos comentários a esta resposta. Essa pergunta tem uma resposta, além da trivial "use bootstrap não paramétrico"?
fonte
Respostas:
Uma maneira de isso funcionar sem o bootstrapping (que na prática pode ser a coisa mais rápida a ser implementada) seria:
Como alternativa, pode-se "apenas" integrar as probabilidades do log a partir da previsão conjunta de resultados e probabilidades do log, mas acredito que será uma bagunça completa, sem solução de formulário fechado.
fonte