Problema: estou parametrizando distribuições para uso como prioros e dados em uma metanálise bayesiana. Os dados são fornecidos na literatura como estatística resumida, quase exclusivamente assumida como sendo normalmente distribuída (embora nenhuma das variáveis possa ser <0, algumas são proporções, outras são massa etc.).
Me deparei com dois casos para os quais não tenho solução. Às vezes, o parâmetro de interesse é o inverso dos dados ou a proporção de duas variáveis.
Exemplos:
- a proporção de duas variáveis normalmente distribuídas:
- dados: média e sd para porcentagem de nitrogênio e porcentagem de carbono
- parâmetro: proporção de carbono para nitrogênio.
- o inverso de uma variável normalmente distribuída:
- dados: massa / área
- parâmetro: área / massa
Minha abordagem atual é usar a simulação:
por exemplo, para um conjunto de dados percentuais de carbono e nitrogênio com médias: xbar.n, c, variação: se.n, ce tamanho da amostra: nn, nc:
set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N
Quero parametrizar ratio.cn = perc.c / perc.n
# parameter of interest
ratio.cn <- perc.c / perc.n
Em seguida, escolha as distribuições de melhor ajuste com intervalo para o meu
library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}
Pergunta: Essa é uma abordagem válida? Existem outras / melhores abordagens?
Desde já, obrigado!
Atualização: a distribuição de Cauchy, que é definida como a razão de duas normais com , tem utilidade limitada, pois eu gostaria de estimar a variação. Talvez eu pudesse calcular a variação de uma simulação de n draws de um Cauchy?
Fiz encontrar os seguintes aproximações de forma fechada mas não testado para ver se eles dão os mesmos resultados ... Hayya et al, 1975 μ y : x = μ y / m u x + σ 2 x * μ y / μ 3 x + c o v ( x , y ) * σ 2 x * σ 2 y / μ 2 x σ 2 y
Hayya, J. e Armstrong, D. e Gressis, N., 1975. Uma nota sobre a razão de duas variáveis normalmente distribuídas. Ciência da Administração 21: 1338--1341
fonte
Respostas:
Você pode querer olhar para algumas das referências no artigo da Wikipedia sobre Distribuição de proporção . É possível que você encontre melhores aproximações ou distribuições para usar. Caso contrário, sua abordagem parecerá correta.
Atualização Acho que uma referência melhor pode ser:
Consulte as fórmulas 2-4 na página 195.
Atualização 2
Em sua pergunta atualizada sobre variação de um Cauchy - como John Cook apontou nos comentários, a variação não existe. Portanto, obter uma variação da amostra simplesmente não funcionará como um "estimador". De fato, você descobrirá que sua variação de amostra não converge e flutua bastante à medida que você continua colhendo amostras.
fonte
Você não poderia assumir quey- 1∼ N( . , . ) para o inverso de uma variável aleatória normal e faça o cálculo bayesiano necessário após identificar os parâmetros apropriados para a distribuição normal.
Minha sugestão abaixo para usar o Cauchy não funciona como apontado nos comentários de ars e John.
A proporção de duas variáveis normalmente aleatórias segue a distribuição de Cauchy . Você pode usar essa idéia para identificar os parâmetros do cauchy que melhor se ajustam aos dados que você possui.fonte