Como obter uma pontuação de confiança para as previsões?

Respostas:

7

Independentemente do modelo, você sempre pode usar o bootstrap não paramétrico para construir um intervalo de confiança para qualquer parâmetro, incluindo previsões (que são na verdade variáveis ​​aleatórias em si, mas são relatadas como expectativas). Aqui está o procedimento geral:

  1. Deixei N denotar o número de observações em seus dados de treinamento Xe xj denotar a observação específica cuja previsão, y^j, você deseja um IC para.
  2. Deixei K denota um número de iterações de reamostragem (deve ser 20 para um IC com cobertura 95%)
  3. Para Eu no K, desenhe um N amostras aleatórias de Xcom substituição. Denote issoXEu
  4. Treine um modelo XEu e use esse modelo para formar uma previsão sobre xj. Ligue para issoy^jEu
  5. Estimar parâmetros distributivos para y^jda sua amostra. UMA100-α O IC é dado pelo α2 e 100-α2 percentis de y^j.
David Marx
fonte
11
Existe uma maneira de obter esse intervalo de confiança para um modelo que já está treinado?
Rodrigo Nader
11
Não que eu saiba. Se você fingir que seus resíduos são iid (provavelmente não estão com esses modelos), você pode estimar a distribuição dos resíduos diretamente e daí derivar intervalos de previsão. Não tenho certeza se isso atende às suas necessidades. Se você está tentando identificar quais previsões o seu modelo tem mais ou menos "certeza", isso não lhe dará isso.
David Marx
@davidmarx Por que precisamos da suposição iid? se tivermos dados de validação suficientes, não podemos considerar os erros como o parâmetro a ser estimado e criar um segundo modelo de regressão para estimar?
ihadanny