Que distribuições anteriores poderiam / deveriam ser usadas para a variação em um modelo bayesisan hierárquico quando a variação média é de interesse?

16

Em seu artigo amplamente citado, distribuições anteriores para parâmetros de variância em modelos hierárquicos (916 citação até agora no Google Scholar) Gelman propõe que boas distribuições prévias não informativas para a variação em um modelo bayesiano hierárquico são a distribuição uniforme e a distribuição de meia tonelada. Se eu entendi direito, isso funciona bem quando o parâmetro location (por exemplo, a média) é do interesse principal. Às vezes, o parâmetro de variação é do principal interesse, no entanto, por exemplo, ao analisar dados de resposta humana de tarefas de tempo, a variabilidade do tempo geralmente é a medida de interesse. Nesses casos, não está claro para mim como a variabilidade pode ser modelada hierárquica com, por exemplo, distribuições uniformes, pois após a análise desejo obter a credibilidade da variação média, tanto no nível do participante como no nível do grupo.

Minha pergunta é: quais são as distribuições recomendadas na construção de um modelo bayesiano hierárquico quando a variação dos dados é do interesse principal?

Eu sei que a distribuição gama pode ser reparametrizada para ser especificada por média e SD. Por exemplo, o modelo hierárquico abaixo é do livro de Kruschke, Doing Bayesian Data Analysis . Mas Gelman descreve alguns problemas com a distribuição gama em seu artigo e eu ficaria grato por sugestões de alternativas, preferencialmente alternativas que não sejam difíceis de conseguir trabalhar em BUGS / JAGS.

insira a descrição da imagem aqui

Rasmus Bååth
fonte

Respostas:

2

Eu discordo da maneira como você interpreta Gelman com relação à escolha do parâmetro Gamma para escala. A base da modelagem hierárquica é relacionar parâmetros individuais a um comum por meio de uma estrutura com parâmetros desconhecidos (geralmente média e variância). Nesse sentido, o uso de uma distribuição gama para a variação individual (ou lognormal para cauda mais pesada) condicionada à variação média e sua dispersão parece-me válido (pelo menos no que diz respeito aos argumentos de Gelman).

Os críticos de Gelman sobre o parâmetro gama para escala referem-se ao fato de que a gama é usada para aproximar os Jeffreys, definindo valores extremos para seu parâmetro. O problema é que, dependendo de quão extremos esses valores são (o que é bastante arbitrário), o posterior pode ser muito diferente. Esta observação invalida o uso deste prior, pelo menos quando não temos informações para definir no prior. Nessa discussão, parece-me que a gama ou gama inversa nunca é calibrada em termos de média e variação de informações anteriores ou de uma estrutura hierárquica. Portanto, sua recomendação diz respeito a um contexto bem diferente do seu que, se eu entender bem seu objetivo,

peuhp
fonte
0

Em pouco tempo, Gelman descreve problemas no uso de distribuições gama como vagas (ele usa a palavra não informativo ) anteriores para a variação. Pelo contrário, seu problema (e o exemplo de Kruschke) parece se referir ao caso em que existe algum conhecimento sobre a variação. Observe também que a imagem da distribuição da variaçãoτEu não é nada plano.

altroware
fonte