Gaussianos independentes em pares

12

Dado X1,,Xk (iid gaussianos com média 0 e variância ), é possível (como? ) (para ) modo que seja independente em pares gaussianos com média e variância .m = k 2 Y 1 , , Y m Y i 0 11m=k2Y1,,YmYi01

Kaveh
fonte
1
@Suresh, para que não pareça funcionar. E[(Xi+Xj)(Xi+Xk)]=E[Xi2]=1
Kaveh
4
Eu não sei por que, mas acho a resposta do MO para esta pergunta bastante hilária (além do ponteiro para stats.SE): mathoverflow.net/questions/46180/…
Suresh Venkat
2
O que eu estava procurando era algo como usar combinações lineares (que obviamente não funcionam) ou polinômios etc. (que não funcionam imediatamente), mas não consigo pensar em nenhuma noção razoável que a resposta de Shai no fluxo de matemática não atenda.
2
talvez você deva atualizar a pergunta apontando a resposta no MO?
Suresh Venkat
2
Você precisa de uma distribuição conjunta gaussiana? Nesse caso, o que você precisa parece ser impossível, pois essa distribuição é determinada por sua matriz de covariância e, portanto, independência em pares e independência total seriam as mesmas.
MCH

Respostas:

4

A postagem no MathOverflow informa como passar de um pequeno número de variáveis ​​aleatórias uniformes independentes [0,1] independentes para um número maior de variáveis ​​aleatórias uniformes [0,1] independentes independentes de pares. É claro que você pode ir e voltar entre Uniforme [0,1] e Gaussian invertendo o CDF. Mas isso requer análise numérica, pois o CDF não é fechado.

No entanto, existe uma maneira mais simples de passar de gaussiano para uniforme. Dado dois Gaussianos independentes , o ângulo arctan ( X 1 / X 2 ) é uniforme no intervalo [ 0 , 2 π ] .X1,X2arctan(X1/X2)[0,2π]

Da mesma forma, o método Box-Muller transforma duas variáveis ​​uniformes independentes [0,1] em duas variáveis ​​aleatórias gaussianas independentes.

Usando essas duas transformações, você consome dois gaussianos para produzir um uniforme ou dois uniformes para produzir um gaussiano. Portanto, existe apenas um fator de na eficiência da amostragem. Além disso, nenhuma inversão do cdf Normal é necessária.O(1)

David Harris
fonte
-2

Essa construção NÃO fornece variáveis ​​independentes aos pares (de fato, abaixo), conforme solicitado por Anindya, mas fornece variáveis ​​não correlacionadas aos pares, o que é suficiente para obter bons limites de concentração para a soma através de A desigualdade de Chebyshev (e isso é muitas vezes o objetivo final).|Yi,j|=|Yi,j|

Para cada par distinto , deixe , onde é a função de sinal. É claro que cada é uma variável normal com média 0 e variância 1. Para ver que são ortogonais, para(i,j)([k]2)Yi,j=|Xi|σ(XiXj)σ()Yi,j(i,j)(i,j) , observe que que pode ser facilmente verificada para igual a 0 observando os vários casos de possíveis igualdades entre .i,i',J,J'

E[Yi,jYi,j]=E[|XiXi|σ(XiXiXjXj)]
i,i,j,j

PS: Uma versão anterior alegou falsamente a independência aos pares.

arnab
fonte
Não consigo entender por que a média do produto sendo zero implicaria independência.
Tsuyoshi Ito
@ TsuyoshiIto: Suas críticas foram corretas, é claro. Ainda deixei esta resposta, pois acho interessante.
Arnab
2
Se você deseja manter sua publicação, use as precauções necessárias para evitar confundir os leitores. Você pode argumentar que a versão atual (revisão 3) da sua postagem não indica nada de incorreto. É verdade, mas a pergunta faz alguma coisa, e sua postagem responde a outra coisa sem declarar isso. Por favor, entenda que é extremamente confuso para os leitores.
Tsuyoshi Ito