Para um intervalo de previsão de regressão linear você ainda usa E [ Y | X ] = ^ p 0 + β 1 x para gerar o intervalo. Você também usa isso para gerar um intervalo de confiança de E [ Y | x 0 ] . Qual a diferença entre os dois?
regression
confidence-interval
predictive-models
prediction-interval
Pergunta, questão
fonte
fonte
Respostas:
Portanto, um intervalo de previsão será maior que um intervalo de confiança.
fonte
A diferença entre um intervalo de previsão e um intervalo de confiança é o erro padrão.
O erro padrão para um intervalo de confiança na média leva em consideração a incerteza devido à amostragem. A linha que você calculou da sua amostra será diferente da linha que seria calculada se você tivesse toda a população, o erro padrão leva essa incerteza em consideração.
O erro padrão para um intervalo de previsão em uma observação individual leva em consideração a incerteza devido à amostragem como acima, mas também leva em consideração a variabilidade dos indivíduos em torno da média prevista. O erro padrão para o intervalo de previsão será maior que o intervalo de confiança e, portanto, o intervalo de previsão será maior que o intervalo de confiança.
fonte
Achei a seguinte explicação útil:
Fonte: http://www.graphpad.com/support/faqid/1506/
fonte
Uma é a previsão de uma observação futura, e a outra é uma resposta média prevista. Darei uma resposta mais detalhada para, esperançosamente, explicar a diferença e de onde ela vem, bem como como essa diferença se manifesta em intervalos mais amplos de previsão do que de confiança.
Espero que isso torne um pouco mais claro por que o intervalo de previsão é sempre maior e qual é a diferença subjacente entre os dois intervalos. Este exemplo foi adaptado de Faraway, Linear Models com R, Sec. 4.1
fonte
Resposta curta:
Um intervalo de previsão é um intervalo associado a uma variável aleatória ainda a ser observada (previsão).
Um intervalo de confiança é um intervalo associado a um parâmetro e é um conceito frequentista.
Veja aqui a resposta completa de Rob Hyndman, o criador do pacote de previsão em R.
fonte
Esta resposta é para aqueles leitores que não conseguiram entender completamente as respostas anteriores. Vamos discutir um exemplo específico. Suponha que você tente prever o peso das pessoas a partir da altura, sexo (masculino, feminino) e dieta (padrão, baixo carboidrato, vegetariano). Atualmente, existem mais de 8 bilhões de pessoas na Terra. Obviamente, você pode encontrar milhares de pessoas com a mesma altura e outros dois parâmetros, mas com pesos diferentes. Seus pesos diferem enormemente porque alguns deles têm obesidade e outros podem sofrer de fome. A maioria dessas pessoas estará em algum lugar no meio.
Uma tarefa é prever o peso médio de todas as pessoas com os mesmos valores das três variáveis explicativas. Aqui usamos o intervalo de confiança. Outro problema é prever o peso de uma pessoa específica. E não sabemos as circunstâncias vivas desse indivíduo. Aqui o intervalo de previsão deve ser usado. É centrado em torno do mesmo ponto, mas deve ser muito maior que o intervalo de confiança.
fonte