Suponha que eu queira amostrar a partir de uma distribuição contínua . Se eu tiver uma expressão de na formap
onde e f_i são distribuições que podem ser facilmente amostradas, então eu posso facilmente gerar amostras de p por:
- Amostrando um rótulo com probabilidade
- Amostragem
É possível generalizar esse procedimento se o for ocasionalmente negativo? Suspeito ter visto isso feito em algum lugar - possivelmente em um livro, possivelmente na distribuição de Kolmogorov -, então ficaria perfeitamente feliz em aceitar uma referência como resposta.
Se um exemplo brinquedo concreto é útil, digamos que eu gostaria de amostra de
Em princípio, eu poderia expandir isso como a seguinte soma:
Os termos dentro da soma podem ser amostrados independentemente de como variáveis aleatórias gama. Meu problema é evidentemente que os coeficientes são "ocasionalmente" negativos.
Edit 1 : Esclareço que estou procurando gerar amostras exatas de , em vez de calcular as expectativas em . Para os interessados, alguns procedimentos para fazer isso são mencionados nos comentários.
Edit 2 : Encontrei a referência que inclui uma abordagem específica para esse problema, na 'Geração aleatória não uniforme de variáveis de Devroye' . O algoritmo é de 'Uma nota sobre amostragem de combinações de distribuições', de Bignami e de Matteis . O método é efetivamente vincular a densidade de cima pelos termos positivos da soma e, em seguida, usar a amostragem de rejeição com base nesse envelope. Isso corresponde ao método descrito na resposta de @ Xi'an.
Respostas:
Fiquei intrigado com essa questão, mas nunca vi uma solução satisfatória.
Uma propriedade que é possível de usar é que, se uma densidade grava que é um densidade tal que , simulando a partir de rejeitando essas simulações com probabilidade forneça simulações de . No caso atual, é a versão normalizada dos componentes de peso positivo e é o restante
Um primeiro inconveniente computacional desta abordagem é que, apesar simulando primeiro componente escolhido a partir de um , as somas em ambos e deve ser calculado para o passo de rejeição. Se as somas são infinitas, sem versão de formulário fechado, isso torna impossível a implementação do método de aceitação e rejeição .fi g h
Uma segunda dificuldade é que, uma vez que ambas as somas de pesos são da mesma ordem a taxa de rejeiçãonão tem limite superior. Na verdade, se a série associada aos 's não estiver absolutamente convergindo, a probabilidade de aceitação será zero! E o método não pode ser implementado nesta situação.
No caso de uma representação de mistura, se pode ser escrito como o componente pode ser escolhido primeiro e depois o método aplicado ao componente. Mas isso pode ser delicado de implementar, identificando pares que se encaixam em da soma possivelmente infinita não sendo necessariamente viável.f
Eu acho que uma resolução mais eficiente poderia vir da própria representação em série. A geração aleatória não uniforme de Devroye, Seção IV.5, contém uma grande variedade de métodos em série. Por exemplo, o algoritmo a seguir para uma representação alternativa em série do destino quando o ' s convergem para zero com e é uma densidade:
O problema foi considerado recentemente no contexto de estimadores com viés de debiasing para o MCMC, como por exemplo na abordagem de Glynn-Rhee . E o estimador de roleta russa (com uma conexão com o problema da fábrica de Bernoulli). E a metodologia imparcial do MCMC . Mas não há como escapar da questão do sinal ... O que torna seu uso desafiador ao estimar densidades como nos métodos pseudo-marginais.
fonte
Eu tenho o rascunho de uma ideia que poderia funcionar. Não é exato , mas espero que seja assintoticamente exato. Para transformá-lo em um método realmente rigoroso, onde a aproximação é controlada, ou algo sobre isso pode ser comprovado, provavelmente há muito trabalho necessário.
Em primeiro lugar, tal como mencionado por Xian é possível agrupar os pesos positivos, por um lado e os pesos negativos sobre o outro lado, de modo que, finalmente, que o problema tem apenas duas distribuições e :g h
com . Observe que você possui .λ−μ=1 λ≥1
Minha ideia é a seguinte. Você quer exemplos de observações da . Faz:N p
No final, você recebe pontos. Não precisa ser exatamente o vizinho mais próximo, mas apenas um ponto "próximo o suficiente". O primeiro passo é como gerar matéria. O segundo passo é como gerar antimatéria e deixá-la colidir e cancelar com a matéria. Esse método não é exato, mas acredito que, sob algumas condições, é assintoticamente exato para grande (para torná-lo quase exato para pequeno, você precisa usar um grande primeiro e depois tirar uma pequena parte aleatória da lista final) . Estou dando um argumento muito informal que é mais uma explicação do que uma prova.(λ−μ)N=N N n N
Considere no espaço de observação e um pequeno volume torno de com o volume de Lebesgue . Após a amostragem de , o número de elementos na lista que também está em é aproximadamente . Após a segunda etapa, aproximadamente serão removidos e você terá aproximadamente o número desejado . Para isso, você precisa assumir que o número de pontos no volume é suficientemente grande.x v x ϵ g v λNg(x)ϵ μNh(x)ϵ Np(x)ϵ
É muito improvável que esse método resista a grandes dimensões ou a algumas patologias de e mas pode funcionar em pequena dimensão e em distribuições "suficientemente uniformes" suficientemente suaves.g h
Nota sobre um método exato:
Primeiro pensei nisso para distribuições discretas e, claramente, nesse caso, o método não é exato, pois pode gerar amostras com probabilidade 0. Tenho a forte intuição de que um método exato não é possível com tempo de processamento finito e que esse método impossibilidade poderia ser comprovada, pelo menos para distribuições discretas. A regra do jogo é que você só estão autorizados a utilizar exatas samplers "oracle" para e , mas não sei e em função de . Para simplificar, restrinja as distribuições de Bernoulli. A inexistência de um método exato está relacionada à teoria da Fábrica de Bernoulli : se você pudesse criar uma moeda partir de umag h g h x (λp−μq) p -coin e -coin, você pode criar uma moeda a partir de uma moeda que é conhecida por ser impossível para .q λp p λ>1
fonte