Limites de cauda na norma euclidiana para distribuição uniforme em

11

Quais são os limites superiores conhecidos de quantas vezes a norma euclidiana de um elemento uniformemente escolhido de será maior que um determinado limite?{n, (n1), ..., n1, n}d

Estou interessado principalmente em limites que convergem exponencialmente em zero quando é muito menor que .nd

Ricky Demer
fonte
É fácil responder aos limites você está apenas computando volumes de hiperesferas -, mas é mais difícil calcular isso para . Você está em uma dessas situações? tnt>n
whuber
3
Eu precisaria. t>n
Ricky Demer
1
Não tenho tempo para postar uma resposta detalhada no momento, mas aqui está uma dica: Compare com uma variável aleatória binomial com a mesma média empregando a técnica padrão de Chernoff. Isso produzirá um limite da forma para e apropriados, desde que que faça sentido quando você pensar sobre o que significa a distância euclidiana quadrada é. Espero que ajude alguns. a d e - b t 2 a b t > n k(Xk/n)2adebt2abt>nd(n+1)/3n
cardeal

Respostas:

1

Intuitivamente, deve ser óbvio que um ponto cujas coordenadas são amostradas aleatoriamente a partir da distribuição uniforme deve ter um pequeno módulo devido à maldição da dimensionalidade. À medida que aumenta, a probabilidade de um ponto amostrado aleatoriamente a partir do volume da bola unitária dimensional ter distância menor ou igual a do centro é , que cai exponencialmente rapidamente.d £ £ dddϵϵd

Vou dar a versão completa da solução do cardeal.

Seja uma cópia independente de uma distribuição discreta e uniforme sobre os números inteiros . Claramente, , e é facilmente calculado queXinknE[X]=0Var(Xi)=n(n+1)3

Lembre-se de que e queE[Xi2]=Var(Xi)+E[Xi]2Var(Xi2)=E[Xi4]E[Xi2]2

Assim,E[Xi2]=Var(Xi)=n(n+1)3

Var(Xi2)=E[Xi4]E[Xi2]2=n(n+1)(3n2+3n+1)15(n(n+1)3)2

E[Xi4] computação

SejaYi=Xi2

i=1dYi=(Distance of Randomly Sampled Point to Origin)2

Terminarei isso amanhã, mas você pode ver que essa variável tem uma média de cerca de , enquanto menos de fração de pontos tem distâncias inferiores a metade da distância máximan232ddn22

Michael K
fonte
0

Se todos os seguem uniformes discretos independentes sobre , então como existem valores para escolher e sua média é 0, temos para todos :Xi[n,n]2n+1i

E(Xi)=0 e

V(Xi)=E((XiE(Xi))2)=E(Xi2)=(2n+1)2112=n(n+1)3

Então, se é a norma euclidiana quadrada do vetor e por causa da independência do :S(X1,X2,...Xd)Xi

S=i=1dXi2

E(S)=i=1dE(Xi2)=dn(n+1)3

A partir daqui, você pode usar a desigualdade de Markov:a>0,P(Sa)1aE(S)

P(Sa)dan(n+1)3

Esse limite aumenta com , o que é normal porque quando aumenta, a norma euclidiana aumenta quando comparada a um limite fixo .dda

Agora, se você definir como uma norma quadrada "normalizada" (que tem o mesmo valor esperado, independentemente do tamanho ), você obtém:Sd

S=1dY=1di=1dXi2

E(S)=n(n+1)3

P(Sa)n(n+1)3a

Pelo menos esse limite não aumenta com , mas ainda está longe de resolver sua busca por um limite decrescente exponencialmente! Gostaria de saber se isso pode ser devido à fraqueza da desigualdade de Markov ...d

Eu acho que você deveria precisar sua pergunta, porque, como afirmado acima, a norma euclidiana média de seus vetores aumenta linearmente em , então é muito improvável que você encontre um limite superior para que está diminuindo em com um limite fixo .dP(S>a)da

jubo
fonte