Redução de dimensionalidade com folga?

11

O lema Johnson-Lindenstrauss diz aproximadamente que para qualquer coleção de pontos em , existe um mapa onde tal que para todos : É sabido que declarações semelhantes não são possíveis para a métrica , mas é sabido se existe alguma maneira de contornar tais valores inferiores limites, oferecendo garantias mais fracas? Por exemplo, pode haver uma versão do lema acima para on R d F : R dR k k = O ( log n / ε 2 ) x , y S ( 1 - ε ) | | f ( x ) - f ( y ) | | 2| | x - y | | 2( 1 + ϵ ) |SnRdf:RdRkk=O(logn/ϵ2)x,yS1 1

(1ϵ)||f(x)f(y)||2||xy||2(1+ϵ)||f(x)f(y)||2
11métrica que promete apenas preservar as distâncias da maioria dos pontos, mas pode deixar algumas distorcidas arbitrariamente? Um que não oferece garantia multiplicativa para pontos "muito próximos"?
Aaron Roth
fonte

Respostas:

9

A referência padrão para um resultado tão positivo é o artigo de Piotr Indyk sobre distribuições estáveis:

http://people.csail.mit.edu/indyk/st-fin.ps

Ele mostra uma técnica de redução de dimensão para que a distância entre qualquer par de pontos não aumenta (mais do que o fator ) com probabilidade constante e as distâncias não diminuem (em mais do que o fator ) com alta probabilidade. A dimensão da incorporação será exponencial em .11+ϵ1ϵ1/ϵ

Provavelmente existem trabalhos de acompanhamento dos quais não estou ciente.

Moritz
fonte
7

Foi recentemente demonstrado por Newman e Rabinovich que, para n pontos em há redução de dimensão para a dimensão . Usando um teorema de Abraham et al. (Incorporação métrica com garantias relaxadas, mencionadas acima), é possível obter uma redução de dimensão na dimensão que funciona para uma fração de dos pares. S ( n / ε )1O(n/ϵ)O(1/(δϵ))1δ

Yair
fonte
4

Outro relaxamento da redução de dimensão é exigir que esteja em um subespaço dimensional de e faça depender de . Talagrand provou que, dado um subespaço dimensional de (ele até prova para ), existe um mapa para tal que para todos , S c R d k c c V1ScRdkccV1dL1f:1d1kk=O(ϵ2clogc)x,yV f S(1ϵ)f(x)f(y)1xy1(1+ϵ)f(x)f(y)1. Sua incorporação é um procedimento aleatório simples, mas prossegue em etapas e cada etapa é bem-sucedida com probabilidade constante; após cada etapa, é necessário verificar se a etapa foi bem-sucedida e repita se não tiver. Incorporação de tão Talagrand falta uma característica crucial da JLT: o fato de que pode ser escolhido a partir de uma distribuição que é independente do .fS

Muito recentemente, Woodruff e Sohler provaram um resultado análogo ao de Talagrand, mas com o recurso adicional de que , assim como no JLT, é um mapeamento linear escolhido de uma distribuição independente de : você precisa escolher uma matriz em que cada entrada é uma variável aleatória iid Cauchy. Isso está no espírito das projeções estáveis ​​de Indyk: Cauchy é 1-estável. S k × dfSk×d

Sasho Nikolov
fonte