Amostragem normalmente do simplex padrão

7

Eu quero ser capaz de gerar valores de um ndistribuição gaussiana multivariada tridimensional truncada para [0,1] variam com os meios dados e uma matriz de covariância, de modo que eles somam um.

Eu acho que isso é o mesmo que amostragem do padrão n-simplex de acordo com a distribuição gaussiana, mas como eu faria isso?

sam10269
fonte
Obrigado pela sua resposta rápida, eu estava tentando usar isso para gerar aleatoriamente pesos de acordo com o normal. Portanto, outra restrição seria todos os valores entre 0 e 1, o que tornaria uma distribuição truncada. Eu também esperava poder refinar ainda mais estes, por exemplo. X1 entre .2 e .3, mas eu estava tentando entender a idéia principal primeiro.
sam10269
Estou tentando simular diferentes ativos de um portfólio de investimentos. Estou assumindo a normalidade de cada ativo, então quero que toda a distribuição multivariada seja normal e a ponderação de cada ativo seja igual a 1. As estatísticas nunca foram meu ponto forte, então peço desculpas se esse é o caminho errado.
sam10269
5
Editei sua pergunta para adicionar as informações que você está falando sobre distribuição normal truncada. O PS verifica aqui para saber mais sobre a distribuição Dirichlet , pois geralmente é uma "distribuição de escolha" para esses problemas.
Tim
sampling from the standard n-simplex according to the Gaussian distribution é uma contradição de termos, uma vez que a distribuição gaussiana é definida no todo Rpespaço.
Xian
Para tornar a pergunta precisa, você pode anotar a densidade que deseja simular no padrão n-simplex?
Xian

Respostas:

3

Estes trabalhos descrevem como obter amostras de um normal multivariado truncado em um (p - 1) simplex ([ http://ieeexplore.ieee.org/abstract/document/6884588/] , [dobigeon.perso.enseeiht.fr/papers/ Dobigeon_TechReport_2007b.pdf]). A amostragem é feita via Gibbs ou HMC. Em resumo, ele usa idéias da distribuição Normal multivariada (condicional). Suponha que você queira provar um vetorα(p×1) que é retido para um Normal Multivariado truncado em um p1 simplex, ou seja, αN(μ,Σ)I(αSp1). Você pode experimentar ojth componente (αj) condicional em αj (ou seja, os componentes restantes de α) e defina o último componente (pth) para 1j=1p1αj com média condicional μj|j e variação condicional Σj|j. Os artigos que mencionei descrevem como calculá-los. Observe que há apenasp1 Partes da informação.

Napo Vargas
fonte
2

Parece que você deseja a distribuição normal de logit . Essa distribuição aparece muito na análise de dados composicionais (CDA). O CDA é frequentemente usado em geologia para medir a composição de minerais em amostras de solo ou rocha. O logit-normal assume uma transformação de logit de sua variável aleatória e essa variável aleatória transformada em logit é uma variável aleatória distribuída normalmente. Formalmente,

Y=log(X1X)

Onde X é logit-normal e Yé normal. Existem extensões multivariadas e são as formas mais usadas da densidade.

Se isso não é o que você deseja e realmente deseja que uma variável aleatória normal, restrita por uma coleção de restrições, seja sempre 1 e tenha todas as entradas como não negativas, será necessário recorrer a outras técnicas de simulação para obter empates. da distribuição. É bastante complicado realizar esses empates. John Geweke escreveu um artigo sobre isso e Christian Robert também escreveu um artigo sobre amostragem desse tipo de distribuição.

Lucas Roberts
fonte
Obrigado pelas referências. Nossos documentos paralelos lidavam com restrições para abrir conjuntos. Lidar com o conjunto de medidas zero de que a soma dos componentes se soma a um não é coberto por nossa abordagem, acredito.
Xian
@ Xi'an, Quando escrevi esta resposta, a pergunta não foi esclarecida se o OP estava tentando amostrar uma distribuição com truncamentos que acredito que seu artigo sobre o endereço ou a probabilidade de John Geweke seja simples como o logit- normal ou nenhum e de fato um gaussiano com restrições simples. Agora, parece que o OP quer colher amostras deste último; Gaussiano multivariado com restrições simplex em cima do Gaussiano (não negatividade e soma de 1 restrições precisam ser satisfeitas). Infelizmente, nenhuma das abordagens aqui descritas aborda a questão do OP.
Lucas Roberts