Limites de cauda na norma euclidiana para distribuição uniforme em

11

Quais são os limites superiores conhecidos de quantas vezes a norma euclidiana de um elemento uniformemente escolhido de será maior que um determinado limite? $\:\{-n,~-(n-1),~...,~n-1,~n\}^d\:$

Estou interessado principalmente em limites que convergem exponencialmente em zero quando é muito menor que . $n$ $d$

uniform extreme-value bounds Ricky Demer
fonte

É fácil responder aos limites você está apenas computando volumes de hiperesferas -, mas é mais difícil calcular isso para . Você está em uma dessas situações?

t \leq n

$t\le n$

t > n

$t \gt n$

whuber

3

Eu precisaria.

t > n

$\: t > n \;\;$

$\;\;\;\;$

Ricky Demer

1

Não tenho tempo para postar uma resposta detalhada no momento, mas aqui está uma dica: Compare com uma variável aleatória binomial com a mesma média empregando a técnica padrão de Chernoff. Isso produzirá um limite da forma para e apropriados, desde que que faça sentido quando você pensar sobre o que significa a distância euclidiana quadrada é. Espero que ajude alguns.

\sum_{k} (X_{k} / n)^{2}

$\sum_k (X_k/n)^2$

a^{d} e^{- b t^{2}}

$a^d e^{-b t^2}$

a

$a$

b

$b$

t > n \sqrt{d (n + 1) / 3 n}

$t > n \sqrt{d (n+1)/3n}$

cardeal

1

Intuitivamente, deve ser óbvio que um ponto cujas coordenadas são amostradas aleatoriamente a partir da distribuição uniforme deve ter um pequeno módulo devido à maldição da dimensionalidade. À medida que aumenta, a probabilidade de um ponto amostrado aleatoriamente a partir do volume da bola unitária dimensional ter distância menor ou igual a do centro é , que cai exponencialmente rapidamente. $d$ $d$ $\epsilon$ $\epsilon^{d}$

Vou dar a versão completa da solução do cardeal.

Seja uma cópia independente de uma distribuição discreta e uniforme sobre os números inteiros . Claramente, , e é facilmente calculado que $X_i$ $-n \leqslant k \leqslant n$ $\mathbb{E}[X] = 0$ $\text{Var}(X_i) = \frac{n(n+1)}{3}$

Lembre-se de que e que $\mathbb{E}[X_i^2] = \text{Var}(X_i) + \mathbb{E}[X_i]^2$ $\text{Var}(X_i^2) = \mathbb{E}[X_i^4] - \mathbb{E}[X_i^2]^2$

Assim, $\mathbb{E}[X_i^2] = \text{Var}(X_i) = \frac{n(n+1)}{3}$

$\text{Var}(X_i^2) = \mathbb{E}[X_i^4] - \mathbb{E}[X_i^2]^2 = \frac{n(n+1)(3n^2 + 3n + 1)}{15} - \left( \frac{n(n+1)}{3} \right)^2$

$\mathbb{E}[X_i^4]$ computação

Seja $Y_i = X_i^2$

\sum_{i = 1}^{d} Y_{i} = (Distance of Randomly Sampled Point to Origin)^{2}

$\sum_{i=1}^d Y_i = (\text{Distance of Randomly Sampled Point to Origin})^2$

Terminarei isso amanhã, mas você pode ver que essa variável tem uma média de cerca de , enquanto menos de fração de pontos tem distâncias inferiores a metade da distância máxima $\frac{n^2}{3}$ $2^{-d}$ $\frac{dn^2}{2}$

Michael K
fonte

0

Se todos os seguem uniformes discretos independentes sobre , então como existem valores para escolher e sua média é 0, temos para todos : $X_i$ $[-n, n]$ $2n+1$ $i$

$\mathbb{E}(X_i)= 0$ e

$\mathbb{V}(X_i)= \mathbb{E}\left((X_i - \mathbb{E}(X_i))^2\right)= \mathbb{E}(X_i^2)= \frac{(2n+1)^2 - 1}{12}= \frac{n(n+1)}{3}$

Então, se é a norma euclidiana quadrada do vetor e por causa da independência do : $S$ $(X_1, X_2, ... X_d)$ $X_i$

$S= \sum_{i=1}^d X_i^2$

$\mathbb{E}(S)= \sum_{i=1}^d \mathbb{E}(X_i^2) = d \frac{n(n+1)}{3}$

A partir daqui, você pode usar a desigualdade de Markov: $\forall a >0, \mathbb{P}(S \geq a) \leq \frac{1}{a}\mathbb{E}(S)$

$\mathbb{P}(S \geq a) \leq \frac{d}{a}\frac{n(n+1)}{3}$

Esse limite aumenta com , o que é normal porque quando aumenta, a norma euclidiana aumenta quando comparada a um limite fixo . $d$ $d$ $a$

Agora, se você definir como uma norma quadrada "normalizada" (que tem o mesmo valor esperado, independentemente do tamanho ), você obtém: $S^*$ $d$

$S^*= \frac{1}{d} Y = \frac{1}{d} \sum_{i=1}^d X_i^2$

$\mathbb{E}(S^*) = \frac{n(n+1)}{3}$

$\mathbb{P}(S \geq a) \leq \frac{n(n+1)}{3a}$

Pelo menos esse limite não aumenta com , mas ainda está longe de resolver sua busca por um limite decrescente exponencialmente! Gostaria de saber se isso pode ser devido à fraqueza da desigualdade de Markov ... $d$

Eu acho que você deveria precisar sua pergunta, porque, como afirmado acima, a norma euclidiana média de seus vetores aumenta linearmente em , então é muito improvável que você encontre um limite superior para que está diminuindo em com um limite fixo . $d$ $\mathbb{P}(S > a)$ $d$ $a$

jubo
fonte

Limites de cauda na norma euclidiana para distribuição uniforme em

Respostas: