Eu sei que o prior de Zellner está usando dados para definir informações anteriores, mas, na verdade, todo o modelo depende dos dados. Existe algum outro
Eu sei que o prior de Zellner está usando dados para definir informações anteriores, mas, na verdade, todo o modelo depende dos dados. Existe algum outro
Exemplos: Eu tenho uma frase na descrição do trabalho: "Java senior engineer in UK". Eu quero usar um modelo de aprendizado profundo para prever em duas categorias: English e IT jobs. Se eu usar o modelo de classificação tradicional, ele poderá prever apenas 1 rótulo com softmaxfunção na última...
Suponha que eu receberei algumas amostras de uma distribuição binomial. Uma maneira de modelar meu conhecimento prévio é com uma distribuição Beta com os parâmetros e β . Pelo que entendi, isso é equivalente a ter visto "cabeças" α vezes em testes α + β . Como tal, um bom atalho para fazer a...
Estou usando a regressão Softmax para um problema de classificação de várias classes. Não tenho probabilidades anteriores iguais para cada uma das classes. Sei pela Regressão Logística (regressão softmax com 2 classes) que as probabilidades anteriores das classes são implicitamente adicionadas ao...
O artigo da Wikipedia sobre distribuição Gamma lista dois métodos diferentes de parametrização, um deles freqüentemente usado na econometria bayesiana com e , é o parâmetro shape, é o parâmetro rate.α>0α>0\alpha>0β>0β>0\beta>0αα\alphaββ\beta X∼Gamma(α,β).X∼Gamma(α,β).X\sim...
Dado que a estimativa posterior de de uma probabilidade normal e uma gama inversa anterior a é:σ′2σ′2\sigma'^{2}σ2σ2\sigma^2 σ′2∼IG(α+n2,β+∑ni=1(yi−μ)22)σ′2∼IG(α+n2,β+∑i=1n(yi−μ)22)\sigma'^{2}\sim\textrm{IG}\left(\alpha + \frac{n}{2}, \beta +\frac{\sum_{i=1}^n{(y_i-\mu)^2}}{2}\right) que é...
Estou trabalhando em um modelo que conta com uma função parametrizada feia que atua como uma função de calibração em uma parte do modelo. Usando uma configuração bayesiana, preciso obter informações preliminares não informativas para os parâmetros que descrevem minha função. Eu sei que, idealmente,...
Eu tenho duas perguntas, Pergunta 1: Como posso mostrar que a distribuição posterior é uma distribuição beta se a probabilidade é binomial e a anterior é beta Pergunta 2: Como as escolhas dos parâmetros anteriores afetam a posterior? Eles não deveriam ser todos iguais? É possível responder a...
Na análise de dados bayesiana , capítulo 13, página 317, segundo parágrafo completo, nas aproximações modal e distributiva, Gelman et al. Escreva: Se o plano é resumir a inferência pelo modo posterior de [o parâmetro de correlação em uma distribuição normal bivariada], substituiríamos a...
A função de probabilidade de uma distribuição lognormal é: f(x;μ,σ)∝∏ni11σxiexp(−(lnxi−μ)22σ2)f(x;μ,σ)∝∏i1n1σxiexp(−(lnxi−μ)22σ2)f(x; \mu, \sigma) \propto \prod_{i_1}^n \frac{1}{\sigma x_i} \exp \left ( - \frac{(\ln{x_i} - \mu)^2}{2 \sigma^2} \right ) e o Prior de Jeffreys...
Priores não informativos são preferidos nos casos em que o viés não é aceitável (por exemplo, salas de audiências, etc.) No entanto, parece-me que faria sentido usar uma abordagem freqüentista. Por que a abordagem bayesiana tem um prévio não
Eu tenho uma pergunta sobre a mistura de conjugados anteriores. Aprendi e digo a mistura de conjugados anteriores algumas vezes quando estou aprendendo bayesiano. Estou me perguntando por que esse teorema é tão importante, como vamos aplicá-lo quando estivermos fazendo uma análise bayesiana. Para...
Se o meu prior é modelado como uma distribuição de probabilidade contínua, digamos, uma distribuição beta distorcida para refletir meu viés em relação a determinados modelos, como posso calcular a probabilidade posterior? O desafio para mim é calcular a probabilidade de um determinado modelo, uma...
Atualmente, estou lendo artigos sobre PCA probabilístico e me pergunto por que o prior gaussiano (e não outro prior) é escolhido para as variáveis latentes? É apenas porque é simples ou há outro motivo? Referências: Tipping & Bishop, 1999, Análise Probabilística de Componentes Principais -...
Dada a probabilidade gaussiana de uma amostra como com sendo o espaço de parâmetro e , parametrizações arbitrárias do vetor médio e da matriz de covariância.yyyp(y|θ)=N(y;μ(θ),Σ(θ))p(y|θ)=N(y;μ(θ),Σ(θ))p(y|\theta) =
Eu li os ótimos comentários sobre como lidar com valores ausentes antes de aplicar o SVD, mas gostaria de saber como ele funciona com um exemplo simples: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada a matriz acima, se eu remover os valores de NA, acabarei...
Na entrada da Wikipedia para o critério de informação Akaike , lemos em Comparação com BIC (critério de informação bayesiano) que ... AIC / AICc tem vantagens teóricas sobre BIC ... AIC / AICc é derivado de princípios de informação; O BIC não é ... O BIC tem um prioritário de 1 / R (onde R é o...
Estou tentando aprender o básico da decisão bayesiana e me deparei com a frase "anterior apropriado", mas realmente não entendo o que isso significa. Alguém
Uma abordagem para a comparação de modelos em uma estrutura bayesiana usa uma variável de indicador de Bernoulli para determinar qual dos dois modelos provavelmente é o "modelo verdadeiro". Ao aplicar ferramentas baseadas no MCMC para ajustar esse modelo, é comum usar pseudo-anteriores para...
Todo estimador de Bayes é admissível, pelo que sei. (Questões relacionadas - 1 , 2. ) Lembro-me de meu professor mencionando uma vez durante uma palestra que, pelo menos como uma intuição grosseira, o inverso também é verdadeiro, ou seja, todo estimador admissível é o estimador de Bayes para uma...