A diferença simples entre os dois é que a distribuição posterior depende do parâmetro desconhecido , ou seja, a distribuição posterior é:
onde é a constante de normalização.θp ( θ | x ) = c × p ( x | θ ) p ( θ )
c
Enquanto, por outro lado, a distribuição preditiva posterior não depende do parâmetro desconhecido porque foi integrada, ou seja, a distribuição preditiva posterior é:
θp ( x∗| x ) = ∫Θc × p ( x∗, θ |x ) dθ = ∫Θc × p( x∗| θ)p(θ | x ) dθ
onde é uma nova variável aleatória não observada e é independente de .x∗x
Não vou me debruçar sobre a explicação da distribuição posterior, já que você diz que a entende, mas a distribuição posterior "é a distribuição de uma quantidade desconhecida, tratada como uma variável aleatória, condicionada às evidências obtidas" (Wikipedia). Basicamente, é a distribuição que explica seu parâmetro desconhecido e aleatório.
Por outro lado, a distribuição preditiva posterior tem um significado completamente diferente, pois é a distribuição para dados futuros previstos com base nos dados que você já viu. Portanto, a distribuição preditiva posterior é basicamente usada para prever novos valores de dados.
Se ajudar, é um gráfico de exemplo de uma distribuição posterior e uma distribuição preditiva posterior:
A distribuição preditiva geralmente é usada quando você aprende uma distribuição posterior para o parâmetro de algum tipo de modelo preditivo. Por exemplo, na regressão linear bayesiana, você aprende uma distribuição posterior sobre o parâmetro w do modelo y = wX, com alguns dados observados X.
Então, quando um novo ponto de dados invisível x * chega, você deseja encontrar a distribuição sobre possíveis previsões y * dada a distribuição posterior de w que você acabou de aprender. Essa distribuição sobre os y * possíveis, dada a posterior para w, é a distribuição de previsão.
fonte
Eles se referem a distribuições de duas coisas diferentes.
A distribuição posterior refere-se à distribuição do parâmetro , enquanto a distribuição posterior preditiva (DPP) refere-se à distribuição de futuras observações de dados .
fonte