No algoritmo de modelo de tópico do LDA, vi essa suposição. Mas não sei por que escolheu a distribuição Dirichlet? Não sei se podemos usar a distribuição Uniform sobre Multinomial como um
Uma distribuição a priori na estatística bayesiana que é tal que, quando combinada com a verossimilhança, a posterior resultante é da mesma família de distribuições.
No algoritmo de modelo de tópico do LDA, vi essa suposição. Mas não sei por que escolheu a distribuição Dirichlet? Não sei se podemos usar a distribuição Uniform sobre Multinomial como um
Eu sei que a distribuição beta é conjugada ao binômio. Mas qual é o conjugado anterior ao beta?
Eu tenho tentado entender a idéia de anteriores conjugados nas estatísticas bayesianas por um tempo, mas simplesmente não entendo. Alguém pode explicar a idéia nos termos mais simples possíveis, talvez usando o "prior gaussiano" como
Algumas distribuições têm anteriores conjugados e outras não. Essa distinção é apenas um acidente? Ou seja, você faz as contas e funciona de uma maneira ou de outra, mas na verdade não diz nada de importante sobre a distribuição, exceto o fato em si? Ou a presença ou ausência de um conjugado...
Como calcular o posterior com um N ~ (a, b) anterior após observar n pontos de dados? Suponho que tenhamos que calcular a média e a variação da amostra dos pontos de dados e fazer algum tipo de cálculo que combine o posterior com o anterior, mas não tenho muita certeza de como é a fórmula da...
Existe um conjugado antes da distribuição de Laplace ? Caso contrário, existe uma expressão de forma fechada conhecida que se aproxima do posterior para os parâmetros da distribuição de Laplace? Eu pesquisei bastante por aí, sem sucesso, então meu palpite atual é "não" nas perguntas acima...
Quando inferir a precisão matriz de uma distribuição normal usado para gerar vectores de D-dimensionais \ begin {align} \ mathbf {x_i} & \ sim \ mathcal {N} (\ boldsymbol {\ mu, \ Lambda ^ {- 1}}) \\ \ end {align} geralmente colocamos um Wishart antes de \ boldsymbol {\ Lambda}, pois a...
Além da usabilidade, existe alguma justificativa epistêmica (matemática, filosófica, heurística, etc.) para o uso de anteriores conjugados? Ou geralmente é apenas uma aproximação suficientemente boa e torna as coisas muito mais
A seguir, um trecho da Introdução às Estatísticas Bayesianas de Bolstad . Para todos os especialistas por aí, isso pode ser trivial, mas não entendo como o autor conclui que não precisamos fazer nenhuma integração para calcular a probabilidade posterior de algum valor de . Entendo a segunda...
Os estimadores de Bayes são imunes ao viés de seleção? A maioria dos trabalhos que discutem estimativas em alta dimensão, por exemplo, dados de sequências genômicas completas, muitas vezes levanta a questão do viés de seleção. O viés de seleção decorre do fato de que, embora tenhamos milhares de...
Exemplos: Eu tenho uma frase na descrição do trabalho: "Java senior engineer in UK". Eu quero usar um modelo de aprendizado profundo para prever em duas categorias: English e IT jobs. Se eu usar o modelo de classificação tradicional, ele poderá prever apenas 1 rótulo com softmaxfunção na última...
Dado que a estimativa posterior de de uma probabilidade normal e uma gama inversa anterior a é:σ′2σ′2\sigma'^{2}σ2σ2\sigma^2 σ′2∼IG(α+n2,β+∑ni=1(yi−μ)22)σ′2∼IG(α+n2,β+∑i=1n(yi−μ)22)\sigma'^{2}\sim\textrm{IG}\left(\alpha + \frac{n}{2}, \beta +\frac{\sum_{i=1}^n{(y_i-\mu)^2}}{2}\right) que é...
A função de probabilidade de uma distribuição lognormal é: f(x;μ,σ)∝∏ni11σxiexp(−(lnxi−μ)22σ2)f(x;μ,σ)∝∏i1n1σxiexp(−(lnxi−μ)22σ2)f(x; \mu, \sigma) \propto \prod_{i_1}^n \frac{1}{\sigma x_i} \exp \left ( - \frac{(\ln{x_i} - \mu)^2}{2 \sigma^2} \right ) e o Prior de Jeffreys...
Eu tenho uma pergunta sobre a mistura de conjugados anteriores. Aprendi e digo a mistura de conjugados anteriores algumas vezes quando estou aprendendo bayesiano. Estou me perguntando por que esse teorema é tão importante, como vamos aplicá-lo quando estivermos fazendo uma análise bayesiana. Para...
Não todos os priores conjugadas tem que vir da família exponencial? Caso contrário, que outras famílias são conhecidas por possuírem / produzirem conjugados
Dada a probabilidade gaussiana de uma amostra como com sendo o espaço de parâmetro e , parametrizações arbitrárias do vetor médio e da matriz de covariância.yyyp(y|θ)=N(y;μ(θ),Σ(θ))p(y|θ)=N(y;μ(θ),Σ(θ))p(y|\theta) =