Qual é o significado de ?

10

Qual é o significado de ap=(i=1n|ai(t)|p)1p ?

Essa fórmula é mencionada na quinta página de Um resumo aprimorado do fluxo de dados: o esboço Count-Min e seus aplicativos (que podem ser encontrados aqui ). Estou implementando o esboço Count-Min e posso entender bem os conceitos básicos, mas alguns dos pontos mais sutis são explicados em termos dessa equação e de alguma outra terminologia que não estou familiarizado.

Kaelin Colclasure
fonte

Respostas:

11

É a norma Lp . Veja, por exemplo, os artigos da Wikipedia:

Se você usar , descobrirá que ele resolve a norma euclidiana mais familiar - ou seja, a medida mais familiar usada como comprimento do vetor . Outros valores de p fornecem outras maneiras de medir o comprimento, conforme descrito no artigo - consulte as seções sobre norma euclidiana, norma do táxi, etc.ap=2a

ars
fonte
Existe um livro acessível que você possa recomendar que discuta como e por que as distâncias de Manhattan são úteis nas estatísticas?
Kaelin Colclasure
11
@ Kaelin: Infelizmente não consigo pensar em um texto que discuta isso em particular. Posso dizer que a distância L1 é preferida, pois é menos sensível aos valores extremos. Também está relacionado às distâncias entre distribuições empíricas na teoria das probabilidades (L1 é o dobro da "distância total de variação": en.wikipedia.org/wiki/Total_variation_distance ).
ars
Você pode ver aqui uma explicação intuitiva sobre por que a distância de Manhattan, ou a norma L1, é preferível a outras distâncias. Tudo se resume à "maldição da dimensionalidade". Além disso, para ser mais específico, é o espaço de Lebesgue de funções integráveis, enquanto é o espaço de vetor para vetores que contêm arbitrariamente muitos componentes. Basicamente, quando você está falando sobre somas de recursos, está falando e, ao integrar funções, é . l n l n L nLnlnlnLn
Douglas De Rizzo Meneghetti
6

Este artigo não parece usar as normas maneira essencial - todos os resultados referenciam a norma explicitamente. O problema em si determina qual norma usar. Nesse caso, o interesse se concentra na cardinalidade de vários conjuntos. Um multiset é representado como um vetor de contagens de seus elementos, de onde sua cardinalidade é a mesma que sua norma . Muitas vezes, os resultados comprovados para uma norma podem ser mantidos sem nenhuma alteração necessária na prova para uma ampla faixa de (normalmente ). A oportunidade para uma maior generalidade, sem nenhum custo vai levar muitos trabalhos como este para falar sobre normas.G 1 L 1 p 1 p L pLpL1L1p1pLp

Lp normas vêm à tona nas discussões da dualidade na teoria espacial de Hilbert e Banach. Livros avançados, mas introdutórios (não é uma contradição!) Sobre análise geralmente cobrem esse material completamente. Para uma introdução a algumas das relações entre essas normas, leia sobre a Desigualdade do Titular e a Desigualdade de Minkowski .

whuber
fonte
+1. Embora eu não tenha certeza de que um livro de análise, mesmo que seja Rudin, é "acessível". ;-)
ars
@ars: Sim, mas não conheço ninguém que realmente seja. Por isso, apontei os dois artigos da Wikipedia.
whuber
Eu sei, gostei - é a recomendação certa a fazer caso o OP queira ir mais fundo.
Ars #
2

n | | a | | p V p : V R + p ( v ) | | v | |||a||denota uma função específica, chamada norma , definida em um espaço vetorial. Ele mapeia um elemento dimensional de um espaço vetorial em um número real não negativo. denota uma norma ainda específica definida no espaço vetorial. Seja um espaço vetorial. Qualquer função , também denotadade tal modo quen||a||pVp:VR+p(v)||v||

  1. p é finito e convexo
  2. p(x)=0x=0
  3. αR,xV,p(αx)=|α|p(x)

é chamado de norma em e é chamado de espaço normatizado. Você pode verificar se sua função satisfaz todas essas propriedades. No seu exemplo, também, é um espaço de funções, que é Essa é uma generalização do espaço euclidiano (com a norma euclidiana) com a qual você deve estar familiarizado, que é apenas um caso específico de espaço normativo em que o conjunto subjacente é o ( n-dimensional) números reais e a norma é a chamada norma euclidiana, um caso específico da função que aparece em sua pergunta.( V , p ) ( V , | || | V a i : T T V(V,p)(V,||||Vai:TT

Por exemplo, o plano euclidiano é um espaço normativo tal que , e define a norma em como . Portanto, é apenas um plano e a norma fornece a "magnitude" do vetor. Observe que é apenas um caso especial da norma que você mencionou, de modo que , e você não precisa do operador de valor absoluto porque é uma soma de termos ao quadrado. x = ( x 1 , x 2 ) R 2 R 2 p ( x ) = | | x | | 2 = | | x | | = V=R2x=(x1,x2)R2R2 n=2,p=2,umi(x)=xip(x)=||x||2=||x||=(x1+x2)2=(i=12xi2)1/2n=2,p=2,ai(x)=xi

Esses tópicos são abordados nos livros didáticos de Análise Real ou Álgebra Linear (de uma maneira mais restrita), sob a rubrica de normas ou espaços normatizados.

Diogo
fonte