Distribuição de produtos escalares de dois vetores unitários aleatórios em dimensões

27

Se e são dois vetores de unidades aleatórias independentes em (distribuídos uniformemente em uma esfera de unidades), qual é a distribuição do produto escalar (produto escalar) ?y R D xyxyRDxy

Eu acho que conforme cresce a distribuição rapidamente (?) Se torna normal com média zero e variância diminuindo em dimensões mais altas mas existe uma fórmula explícita para \ sigma ^ 2 (D) ?D

limDσ2(D)0,
σ2(D)

Atualizar

Fiz algumas simulações rápidas. Primeiro, gerando 10000 pares de vetores de unidades aleatórias para D=1000 , é fácil ver que a distribuição de seus produtos pontuais é perfeitamente gaussiana (na verdade, já é bastante gaussiana para D=100 ), veja a subtrama à esquerda. Segundo, para cada D variando de 1 a 10000 (com etapas crescentes), gerei 1000 pares e calculei a variação. Gráfico log-log é mostrado à direita, e é claro que a fórmula é muito bem aproximada por 1/D . Observe que, para D=1 e D=2 esta fórmula fornece resultados exatos (mas não sei ao certo o que acontece depois).

produtos pontuais entre vetores unitários aleatórios

ameba diz Restabelecer Monica
fonte
@KarlOskar: obrigado, este link é muito relevante e, de fato, torna minha pergunta quase duplicada, mas não totalmente. Portanto, existe uma fórmula explícita para que é uma função de distribuição cumulativa dos produtos pontuais. Pode-se usar um derivado para obter o PDF e depois estudar o limite de . No entanto, a fórmula é dada em termos de funções beta e funções beta incompletas, portanto os cálculos provavelmente serão desagradáveis. D P{(x,y)>ϵ}D
Ameba diz Reinstate Monica
@KarlOskar: a partir da distribuição uniforme sobre uma esfera unidade em . Para gerar um vetor aleatório a partir dessa distribuição, pode-se gerar um vetor aleatório a partir de um Gaussiano com uma variação de unidade e normalizá-lo. RD
Ameba diz Reinstate Monica

Respostas:

30

Como ( como é sabido ) uma distribuição uniforme na esfera unitária é obtida normalizando uma distribuição normal variável e o produto escalar de vetores normalizados é seu coeficiente de correlação, as respostas para as três perguntas são: D tSD1Dt

  1. ( ( D - 1 ) / 2 , ( D - 1 ) / 2 )u=(t+1)/2 tem uma distribuição Beta .((D1)/2,(D1)/2)

  2. A variação de é igual a (conforme especulado na pergunta).1 / Dt1/D

  3. A distribuição padronizada de aproxima da normalidade a uma taxa deO ( 1tO(1D).


Método

A distribuição exata do produto escalar dos vetores unitários é facilmente obtida geometricamente, porque esse é o componente do segundo vetor na direção do primeiro. Como o segundo vetor é independente do primeiro e é uniformemente distribuído na esfera unitária, seu componente na primeira direção é distribuído da mesma forma que qualquer coordenada da esfera. (Observe que a distribuição do primeiro vetor não importa.)

Encontrando a densidade

Deixando que a coordenada seja a última, a densidade em é, portanto, proporcional à área da superfície situada a uma altura entre e na esfera unitária. Essa proporção ocorre dentro de uma faixa de altura e raio que é essencialmente um tronco cônico construído a partir de um de raio de altura e inclinação . De onde a probabilidade é proporcional at t + d t d t t[1,1]tt+dtdt1t2,SD2d t 1 / 1t2,dt1/1t2

(1t2)D21t2dt=(1t2)(D3)/2dt.

Deixar implica . Substituindo isso no precedente, o elemento de probabilidade é convertido em uma constante de normalização:u=(t+1)/2[0,1]t=2u1

fD(u)du(1(2u1)2)(D3)/2d(2u1)=2D2(uu2)(D3)/2du.

É imediato que tenha uma distribuição Beta , porque (por definição) sua densidade também é proporcional a( ( D - 1 ) / 2 , ( D - 1u=(t+1)/2((D1)/2,(D1)/2)

u(D1)/21(1u)(D1)/21=(uu2)(D3)/2fD(u).

Determinando o comportamento limitante

As informações sobre o comportamento limitador seguem facilmente isso usando técnicas elementares: pode ser integrado para obter a constante de proporcionalidade ; pode ser integrado (usando propriedades das funções Beta, por exemplo) para obter momentos, mostrando que a variação é e diminui para (daí, pelo Teorema de Chebyshev, a probabilidade está se concentrando perto de ); ea distribuição limitadora é então encontrada considerando valores da densidade da distribuição padronizada, proporcional a para valores pequenos defDtkfD(t)1/D0t=0fDΓ(n2)πΓ(D12)tkfD(t)1/D0t=0fD(t/D),t :

log(fD(t/D))=C(D)+D32log(1t2D)=C(D)(1/2+32D)t2+O(t4D)C12t2

onde os representam constantes (log) de integração. Evidentemente, a taxa na qual isso se aproxima da normalidade (para a qual a densidade do log é igual a ) éCO12t2O(1D).

Figura

Este gráfico mostra as densidades do produto escalar para , conforme padronizado para a variação unitária, e sua densidade limitante. Os valores em aumentam com (de azul a vermelho, dourado e depois verde para a densidade normal padrão). A densidade para seria indistinguível da densidade normal nesta resolução.0 D D = 1000D=4,6,100DD=1000

whuber
fonte
4
(+1) Muito obrigado, @whuber, esta é uma ótima resposta! Agradecimentos especiais por mencionar a palavra "frustum". Acontece que aceitei outra resposta apenas alguns minutos antes de você postar a sua e não gostaria de aceitá-la agora; espero que você entenda. Pena que não é possível aceitar os dois! A propósito, observe uma prova muito simples da expressão de variação dessa resposta: é possível vê-la diretamente sem mexer nas funções beta! A variação do produto escalar é igual à variação de qualquer coordenada de esfera (como você escreveu), e uma soma de todos os deles deve ser , QEDD 11/DD1
ameba diz Reinstate Monica
11
Essa é uma boa observação sobre as variações.
whuber
2
@amoeba, a atividade recente também chamou minha atenção aqui novamente e, por mais que eu aprecie que você tenha aceitado minha resposta, essa é muito mais completa. Eu não me importaria se você mudasse.
Ekvall
11
@ Student001: este é um comentário justo e generoso. Troquei a resposta aceita. Eu também encontrei um Q e um A para votar de forma a compensar isso :)
ameba diz Reinstate Monica
11
@mat A distribuição de é a de . Isso o torna uma distribuição Beta que foi dimensionada e alterada do intervalo para o intervalo . 2 U - 1 [ 0 , 1 ] [ - 1 , 1 ]t2U1[0,1][1,1]
whuber
11

Vamos encontrar a distribuição e a variação segue pelos resultados padrão. Considere o produto vetorial e escreva em sua forma cosseno, ou seja, observe que temos onde é o ângulo entre e . Na última etapa, usei isso para quaisquer eventos eAgora considere o termo . É claro que, como é escolhido uniformemente em relação à superfície da esfera, não importa o queθ x y A B E P ( A B ) : = E [ AB] ] = E χ A = P ( A ) . P ( cos q

P(xyt)=P(|x||y|cosθt)=P(cosθt)=EP(cosθty),
θxyAB
EP(AB):=E[E[χAB]]=EχA=P(A).
P(cosθty)xyna verdade, apenas o ângulo entre e importante. Assim, o termo dentro da expectativa é realmente constante em função de e podemos assumir queEntão obtemos quemas como é a primeira coordenada de um vetor gaussiano normalizado em temos que é gaussiano com variação invocando o resultado assintótico deste artigo .xyyy=[1,0,0,].
P(xyt)=P(x1t).
x1Rn,xy1/n

Para um resultado explícito da variação, use o fato de que o produto escalar é zero com independência e, como mostrado acima, distribuído como a primeira coordenada de . Por esses resultados, encontrar equivale a encontrar . Agora, observe que, por construção , podemos escrever onde a última igualdade segue a partir da qual as coordenadas de são identicamente distribuídas. Juntando as coisas, descobrimos quexVar(xy)Ex12xx=1

1=Exx=Ei=1nxi2=i=1nExi2=nEx12,
xVar(xy)=Ex12=1/n
ekvall
fonte
Obrigado, mas estou confuso: o que exatamente é "o resultado desejado" e como se segue da última equação? A distribuição final probabilidade deve depender . D
Ameba diz Reinstate Monica
Na verdade, como o resultado segue da sua última equação é exatamente o que é discutido no segmento math.SE que você encontrou. Envolve distribuições beta etc., e o comportamento limitador (para mim) está longe de ser óbvio. Eu acho que deve haver uma maneira mais simples direta ao ver que . σ2(D)1/D
Ameba diz Reinstate Monica
Depende da dimensão desde , em que é o vetor gaussiano gerado. Atualizarei a resposta mais tarde hoje ou amanhã. x1=z1|z|1z
Ekvall
Uau, ótimo, seu último link fornece o limite dessa expressão envolvendo funções beta inversas (que eu tinha medo de calcular) na terceira equação na página 1. Portanto, para concluir o raciocínio: se a esfera tiver raio , então é (assintoticamente) distribuído como . O que significa que para a esfera de raio variância unidade é vezes menor, isto é, . No entanto, ainda tenho uma preocupação: verifiquei de 1 a 4 e parece dar variação exata , embora as distribuições de D = 1 ou D = 2 estejam muito longe do normal. Deve haver uma razão mais profunda por trás disso. Dx1N(0,1)D1/DD1/D
amoeba diz Restabelecer Monica
@amoeba Sim, atualizado com uma prova disso.
ekvall
2

Para responder à primeira parte da sua pergunta, indique . Definem O produto dos elementos de e aqui indicados como serão distribuídos de acordo com a distribuição conjunta de e . desde então , Z=X,Y=XiYi

fZi(zi)=fZ1,,ZD(z1,,zD)dzi
ithXYZiXiYi
fZi(zi)=fXi,Yi(x,zix)1|x|dx
Z=Zi
fZ(z)=fZ1,,ZD(z1,,zd)δ(zzi)dz1dzd

Para a segunda parte, acho que se você quiser dizer algo interessante sobre o comportamento assintótico de precisará pelo menos assumir a independência de e e aplicar um CLT.σXY

Por exemplo, se você estava disposto a assumir que são identificados com e você poderia diga que e .{Z1,,ZD}E[Zi]=μV[Zi]=σ2σ2(D)=σ2DlimDσ2(D)=0

tom
fonte
Obrigado, mas estou confuso com a segunda parte. É claro que e devem ser independentes, acrescentarei isso à questão. Você diz que , e isso parece razoável, mas qual é o comportamento assintótico de ? Eu acho que a expressão que eu estou procurando deve depender somente de . A propósito, em 2D se não me engano, pergunto-me se isso permanece verdadeiro em dimensões mais altas ...Y σ 2 ( D ) = V um r ( Z i ) / D V um r ( Z i ) D V um r ( Z i ) = 1 / 2XYσ2(D)=Var(zi)/DVar(zi)DVar(zi)=1/2
ameba diz Reinstate Monica
É realmente possível que o seja independente, dado o requisito de que e tenham comprimento unitário? X YziXY
Ekvall
@ tom: A propósito, eu estava enganado: em 2D é 1, é que é igual a 1/2. Atualizei minha pergunta com alguns resultados de simulação. Parece que a fórmula correcta é . V a r ( z ) 1 / DVar(zi)Var(z)1/D
Ameba diz Reinstate Monica