especialistas! Talvez você saiba como calcular o intervalo de confiança para xgboost? A fórmula clássica com distribuição t não pode ajudar, porque meus dados não são normalmente distribuídos. Ou não importa?
Se você sugerir alguma literatura, será muito útil, mas as abordagens em R e Python (no contexto da biblioteca xgb) também são boas.
Talvez, parece que este , mas como calcular? E encontrou isso - está certo ou não?
PS: Não consigo adicionar algumas fotos relacionadas aos meus dados (limite de links), desculpe.
confidence-interval
xgboost
Lu Wao
fonte
fonte
Respostas:
Então, esta é a resposta! ( espelho )
Para criar limites de confiança para dados distribuídos de maneira anormal, primeiro você precisa criar uma regressão quantil, em vez de uma regressão linear, como faz por padrão. Para isso, é necessário, usando as derivadas derivadas do artigo ou simplesmente copiando o código no python, para personalizar a variável 'objetivo'. Também é necessário alterar a função gradiente e a função gaussiana. Depois que tudo estiver programado, crie uma regressão quantílica para o quinquagésimo quinto (esta será a regressão inicial) e, em seguida, duas regressões quantílicas para os dois limites do intervalo (por exemplo, 95 e 5). Como resultado, você obtém não apenas um modelo mais preciso para a regressão inicial, mas também os intervalos desejados.
fonte