Eu tenho um experimento no qual estou fazendo medições de uma variável normalmente distribuída ,
Entretanto, experimentos anteriores forneceram algumas evidências de que o desvio padrão é uma função afim de uma variável independente , ou seja,X
Gostaria para estimar os parâmetros de e por amostragem em vários valores de . Além disso, devido às limitações do experimento, só posso coletar um número limitado (aproximadamente 30-40) de amostras de e preferiria amostrar em vários valores de por razões experimentais não relacionadas. Dadas estas limitações, o que métodos estão disponíveis para estimar e ?b Y X Y X a b
Descrição da experiência
Esta é uma informação extra, se você estiver interessado em saber por que estou fazendo a pergunta acima. Meu experimento mede a percepção espacial auditiva e visual. I têm uma configuração da experiência em que pode apresentar auditivo ou alvos visuais de diferentes locais, , e sujeitos indicam a localização percebida do alvo, . Tanto a visão * quanto a audição ficam menos precisas com o aumento da excentricidade (ou seja, o aumento de ), que eu modelo como acima. Finalmente, eu gostaria de estimar eY | X | σ a bpara visão e audição, conheço a precisão de cada sentido em vários locais no espaço. Essas estimativas serão usadas para prever a ponderação relativa dos alvos visuais e auditivos quando apresentados simultaneamente (semelhante à teoria da integração multissensorial apresentada aqui: http://www.ncbi.nlm.nih.gov/pubmed/12868643 ).
* Eu sei que esse modelo é impreciso para a visão ao comparar o espaço foveal ao extrafoveal, mas minhas medidas são restritas apenas ao espaço extrafoveal, onde essa é uma aproximação decente.
Respostas:
Em um caso como o seu, no qual você tem um modelo generativo relativamente simples, mas "não-padrão", para o qual gostaria de estimar parâmetros, meu primeiro pensamento seria usar um programa de inferência bayesiano como Stan . A descrição que você forneceu se traduziria muito claramente para um modelo de Stan.
Alguns exemplos de código R, usando RStan (a interface R para Stan).
Você obterá resultados parecidos com este (embora seus números aleatórios provavelmente sejam diferentes dos meus):
O modelo convergiu bem (Rhat = 1), e o tamanho efetivo da amostra (n_eff) é razoavelmente grande em todos os casos, portanto, em um nível técnico, o modelo é bem-comportado. As melhores estimativas de , e (na coluna média) são também bastante próximo ao que foi fornecido.b μa b μ
fonte
Você não pode esperar fórmulas fechadas, mas ainda pode anotar a função de probabilidade e maximizá-la numericamente. Seu modelo é Então a função de probabilidade de log (exceto um termo que não depende dos parâmetros) se torna e isso é fácil de programar e entregue a um otimizador numérico.
Em R, podemos fazer
Em seguida, simule alguns dados:
Em seguida, faça a função loglikelihood:
Em seguida, otimize-o:
fonte