Para algoritmos aleatórios usando valores reais, o "truque mediano" é uma maneira simples de reduzir a probabilidade de falha a qualquer limite , ao custo de apenas uma multiplicativa sobrecarga. Ou seja, se a saída de cair em um "bom intervalo" com probabilidade (pelo menos) , executando cópias independentes e tomando a mediana de suas saídas resultará em um valor caindo em com probabilidade pelo menos pelos limites de Chernoff / Hoeffding. δ > 0 t = O ( log 1UmI=[a,b]2/3A1,...,Atum1,...,umtI1-δ
Existe alguma generalização desse "truque" para dimensões mais altas, digamos , em que o bom intervalo agora é um conjunto convexo (ou uma bola ou qualquer conjunto suficientemente agradável e estruturado)? Ou seja, dado um algoritmo aleatório gera valores em , e um "conjunto bom" tal que para todos , como se pode aumentar a probabilidade de sucesso para com apenas um custo logarítmico em ?A R d S⊆ R d P r { A (x,r)∈S}≥2 / 3x1-δ1 / δ
(Formulado de forma diferente: dado fixo, arbitrário com a garantia de que pelo menos dos pertencem a , existe um procedimento saída de um valor de ? Em caso afirmativo, existe um valor eficiente?)2 t aiSS
E qual é o conjunto mínimo de suposições necessárias em para que o acima seja possível?
Desculpe se isso é trivial - não foi possível encontrar uma referência sobre esta pergunta ...
fonte
Respostas:
O que você está procurando é quase o mesmo, uma tendência central robusta : uma maneira de reduzir uma nuvem de pontos de dados para um único ponto, de modo que, se muitos deles estiverem próximos de alguma "verdade básica", mas o restante deles arbitrariamente distantes, sua saída também estará próxima da verdade básica. O "ponto de ruptura" desse método é a fração de valores discrepantes arbitrariamente ruins que ele pode tolerar. A diferença é que, no seu caso, você deseja substituir "próximo a" por "dentro do casco convexo de".
Uma maneira de capturar isso é com a noção de profundidade de Tukey. Um ponto tem profundidade de Tukey (em relação a um determinado conjunto de pontos de dados) se cada espaço no meio que contenha o ponto especificado também contiver pelo menos pontos de dados. Se houver um bom subespaço convexo no qual você deseja estar, um ponto com profundidade de Tukey estará dentro dele, desde que haja pelo menos dos pontos de dados dentro dele. Portanto, o ponto de detalhamento desse método é o maior valor de que você pode atingir.n p n p ( 1 - p ) n pp n p n p ( 1 - p ) n p
Infelizmente, esse ponto de ruptura é , não próximo a 1/2, tanto para a profundidade de Tukey quanto para o seu problema. Eis o porquê: se seus dados estão agrupados perto dos vértices de um simplex, desde que menos de fração deles sejam outliers (mas você não sabe quais), então qualquer ponto o simplex é seguro de escolher, pois sempre estará dentro do casco convexo dos não-discrepantes. Mas se mais de dos pontos puderem ser discrepantes, não há lugar seguro para escolher: qualquer que seja o ponto simples que você escolher, os discrepantes poderão ser todos os pontos do vértice simplex mais próximo e você estaria fora do casco dos não-discrepantes.d + 1 1 / ( d + 1 ) 1 / ( d + 1 )1 1/(d+1) d+1 1/(d+1) 1/(d+1)
Se você está disposto a tolerar um ponto de ruptura pior, mais parecido com , existe um método aleatório para encontrar um ponto profundo polinomial em e : veja meu artigon dO(1/d2) n d
Pontos centrais aproximados com pontos iterados de Radon, K. Clarkson, D. Eppstein, GL Miller, C. Sturtivant e S.-H. Teng, 9º Symp de ACM. Comp. Geom. , San Diego, 1993, pp. 91–98, Int. J. Comp. Geom. & Appl. 6 (3): 357–377, 1996, http://kenclarkson.org/center/p.pdf
fonte
Essa é uma pergunta interessante e eu já pensei nisso antes. Aqui está o que descobrimos:
Você executar o seu algoritmo de vezes para obter saídas x 1 , ⋯ , x n ∈ R d e você sabe o que com grande probabilidade de uma grande fração de x i queda s em um bom conjunto G . Você não sabe o que é G , apenas que é convexo. A boa notícia é que existe uma maneira de obter um ponto em G sem mais informações. Chame esse ponto de f ( x 1 , ⋯ , x n ) .n x1 1, ⋯ , xn∈ Rd xEu G G G f( x1 1, ⋯ , xn)
Observe que, para , podemos definir f como a mediana. Portanto, isso mostra como generalizar a mediana para d > 1 .d= 1 f d> 1
Antes de provar esse resultado, observe que ele é estanque: Seja e x 1 , ⋯ , x d sejam os elementos base padrão ex x d + 1 = 0 . Qualquer subconjunto de d dos pontos está contido em um espaço afim G da dimensão d - 1 (que é definida exclusivamente por esses pontos). Mas nenhum ponto está contido em todos esses espaços afins. Portanto, existe algum G convexo que contém n ⋅ d / ( d +n = d+ 1 x1 1, ⋯ , xd xd+ 1= 0 d G d- 1 G pontos, mas não contém f ( x 1 , ⋯ , x n ) , qualquer que seja o valor que leva.n ⋅ d/ (d+ 1 ) = d f( x1 1, ⋯ , xn)
Infelizmente, esse resultado não é muito prático no cenário de alta dimensão. Uma boa pergunta é se podemos calcular mais eficiência:f
Além disso: também podemos mudar o problema para obter uma solução eficiente: se têm a propriedade que estritamente mais da metade deles está na bola B ( y , ε ) , então podemos encontrar um ponto z que se encontra em B ( y , 3 ε ) no polinômio do tempo em n e d . Em particular, podemos definir z = x i para um i arbitrário de modo que estritamente mais da metade dos pontos esteja em Bx1,⋯,xn B(y,ε) z B(y,3ε) n d z=xi i .B(z,2ε)
fonte
Existe uma noção da mediana de um conjunto de pontos em altas dimensões e normas gerais que é conhecida sob vários nomes. É apenas o ponto que minimiza a soma das distâncias para todos os pontos do conjunto. Sabe-se que possui uma propriedade de amplificação de confiança semelhante à mediana usual com um pequeno aumento multiplicativo na distância. Você pode encontrar os detalhes no Teorema 3.1 deste artigo: http://arxiv.org/pdf/1308.1334.pdf
Uma coisa interessante que este artigo mostra é que o fator pelo qual a distância aumenta pode ser constante> 1 se você puder amplificar a partir de uma confiança arbitrariamente alta (mas constante <1).
Edit: existe outro artigo recente sobre o tema por Hsu e Sabato http://arxiv.org/pdf/1307.1827v6.pdf Ele analisa e aplica principalmente o procedimento no qual o ponto do conjunto com a menor distância mediana para o resto dos pontos é usado. Este procedimento pode ser usado com qualquer métrica, mas fornece apenas um fator de aproximação de 3.
fonte