Na análise bayesiana conjugada da distribuição gaussiana de Kevin Murphy , ele escreve que a distribuição preditiva posterior é
onde são os dados nos quais o modelo está ajustado e são dados não vistos. O que não entendo é por que a dependência de desaparece no primeiro termo na integral. Usando regras básicas de probabilidade, eu teria esperado:
Pergunta: Por que a dependência de no termo desaparece?
Pelo que vale, eu já vi esse tipo de formulação (descartando variáveis em condicionais) em outros lugares. Por exemplo, em Bayesian Online Changepoint Detection , de Ryan Adam , ele escreve o preditivo posterior como
onde novamente, desde , eu teria esperado