Eu preciso "aprender" a distribuição de um gaussiano bivariado com poucas amostras, mas uma boa hipótese sobre a distribuição anterior, então eu gostaria de usar a abordagem bayesiana.
Eu defini o meu anterior:
E minha distribuição, dada a hipótese
Agora eu sei, graças a aqui, que para estimar a média dada os dados
Eu posso calcular:
Agora vem a pergunta, talvez eu esteja errado, mas parece-me que é apenas a matriz de covariância para estimou o parâmetro μ n , e não a covariância estimada dos meus dados. O que eu gostaria seria calcular também
para que uma distribuição totalmente especificada seja aprendida com meus dados.
Isso é possível? Está já resolvido pelo cálculo e é apenas expresso de forma errada a fórmula acima (ou estou simplesmente misentrepreting-lo)? Referências seriam apreciadas. Muito obrigado.
EDITAR
Pelos comentários, parecia que minha abordagem estava "errada", no sentido de que eu estava assumindo uma covariância constante, definida por . O que eu preciso seria colocar um prior também, P ( Σ ) , mas não sei qual distribuição devo usar e, posteriormente, qual é o procedimento para atualizá-la.
fonte
Respostas:
Você pode fazer atualizações bayesianas para a estrutura de covariância do mesmo modo que atualizou a média. O conjugado anterior para a matriz de covariância do normal multivariado é a distribuição Inverse-Wishart, por isso faz sentido começar por aí,
Então, quando você obtiver sua amostra de comprimento n, poderá calcular a estimativa de covariância da amostra Σ X = 1X n ΣX=1n(X−μ)⊤(X−μ)
Isso pode ser usado para atualizar sua estimativa da matriz de covariância
Você pode optar por usar a média disso como sua estimativa pontual para a covariância (estimador médio posterior)
ou você pode optar por usar o modo (Máximo A estimador posterior)
fonte
Ok, I found the real solution for my problem. I am posting it even if the correct answer to my (misplaced) question is the one selected.
Basically, my question explains how to estimate the mean knowing the covariance, and the answer how to estimate the covariance knowing the mean. But my actual problem was estimating with both parameters unknown.
I found the answer on Wikipedia with the derivation explained here. The multivariate normal's conjugated prior is the Normal-inverse-Wishart, that is basically a distribution over multivariate Normals.
The prior parameters that need to be specified areμ0 to define the mean, Ψ to define the covariance, and two scalar values κ0 and ν0 that I would say define how confident we are on the estimation of the first two parameters respectively.
The updated distribution after observingn samples of a p -variate Normal has the form
where
so my desired estimated parameters are
fonte