O que é uma variedade?

29

Na técnica de redução de dimensionalidade, como Análise de Componentes Principais, LDA etc, geralmente o termo coletor é usado. O que é um coletor em termos não técnicos? Se um ponto pertencer a uma esfera cuja dimensão eu quero reduzir, e se houver um ruído e e não estiverem correlacionados, os pontos reais estarão muito separados um do outro devido ao ruído. Portanto, seria necessária uma filtragem de ruído. Portanto, a redução de dimensão seria realizada em . Portanto, aqui e pertencem a variedades diferentes?y x y x z = x + y x yxyxyxz=x+yxy

Estou trabalhando em dados da nuvem de pontos que são frequentemente usados ​​na visão de robô; as nuvens de pontos são barulhentas devido ao ruído na aquisição e preciso reduzir o ruído antes da redução de dimensão. Caso contrário, receberei uma redução de dimensão incorreta. Então, qual é o coletor aqui e o ruído faz parte do mesmo coletor ao qual pertence?x

Ria George
fonte
5
Não é realmente possível usar o termo corretamente sem ser matematicamente precisa
Chill2Macht

Respostas:

45

Em termos não técnicos, um coletor é uma estrutura geométrica contínua com dimensão finita: uma linha, uma curva, um plano, uma superfície, uma esfera, uma bola, um cilindro, um toro, um "blob" ... algo assim : insira a descrição da imagem aqui

É um termo genérico usado pelos matemáticos para dizer "uma curva" (dimensão 1) ou "superfície" (dimensão 2) ou um objeto 3D (dimensão 3) ... para qualquer dimensão finita possível . Um coletor unidimensional é simplesmente uma curva (linha, círculo ...). Um coletor bidimensional é simplesmente uma superfície (plano, esfera, toro, cilindro ...). Um coletor tridimensional é um "objeto completo" (bola, cubo cheio, o espaço 3D ao nosso redor ...).n

Um coletor é frequentemente descrito por uma equação: o conjunto de pontos , como é um coletor unidimensional (um círculo).x 2 + y 2 = 1(x,y)x2+y2=1

Um coletor tem a mesma dimensão em todos os lugares. Por exemplo, se você anexar uma linha (dimensão 1) a uma esfera (dimensão 2), a estrutura geométrica resultante não será uma variedade.

Diferentemente das noções mais gerais de espaço métrico ou espaço topológico, também destinadas a descrever nossa intuição natural de um conjunto contínuo de pontos, uma variedade deve ser algo localmente simples: como um espaço vetorial de dimensão finita: . Isso exclui espaços abstratos (como espaços de dimensão infinita) que geralmente falham em ter um significado concreto geométrico.Rn

Diferentemente de um espaço vetorial, os coletores podem ter várias formas. Alguns coletores podem ser facilmente visualizados (esfera, bola ...), outros são difíceis de visualizar, como a garrafa de Klein ou o plano projetivo real .

Em estatística, aprendizado de máquina ou matemática aplicada em geral, a palavra "variedade" é frequentemente usada para dizer "como um subespaço linear", mas possivelmente curvada. Sempre que você escrever uma equação linear como: você obtém um subespaço linear (afim) (aqui um plano). Normalmente, quando a equação é não linear como , essa é uma variedade (aqui uma esfera esticada).x 2 + 2 y 2 + 3 z 2 = 73x+2y-4z=1x2+2y2+3z2=7

Por exemplo, a " hipótese do coletor " de ML diz que "dados de alta dimensão são pontos em um coletor de baixa dimensão com adição de ruído dimensional". Você pode imaginar pontos de um círculo 1D com algum ruído 2D adicionado. Enquanto os pontos não estão exatamente no círculo, eles satisfazem estatisticamente a equação . O círculo é a variedade subjacente: x2+y2=1https://i.stack.imgur.com/iEm2m.png

Benoit Sanchez
fonte
4
@RiaGeorge Na imagem, é a superfície que é uma variedade. É contínuo porque você pode se movimentar livremente sem interrupção e nunca tem que saltar fora da superfície para obter entre dois lugares. Os furos aos quais você alude são importantes para descrever como você pode percorrer a superfície entre dois pontos da maneira mais simples, e contá-los é uma técnica importante no estudo de variedades.
Matthew Drury
4
Explicar o que é topologia seria uma pergunta muito ampla para este site e um pouco fora de tópico. Eu procuraria na troca de pilhas de matemática por informações sobre isso. Variedades e topologia não são sinônimos: variedades são objetos matemáticos estudados com as técnicas da topologia, a topologia é um sub-assunto da matemática.
Matthew Drury
1
A resposta perde todos os pontos fundamentais que tornam um múltiplo tal, não entendo como ele tem tantos votos positivos. Topologia, gráficos e suavidade não são sequer mencionadas e a resposta, basicamente, dá a impressão de que é um colector de uma superfície, o qual é não .
gented
2
Ponto técnico, o conjunto de soluções de um sistema de equações não precisa ser múltiplo. É uma variedade, portanto é principalmente uma variedade, mas pode ter pontos de auto-interseção onde a propriedade da variedade falha.
Matt Samuel
1
Sua definição de coletor inclui o requisito de ser de dimensão finita . Mas você inclui exemplos que não atendem a esse requisito - como linhas, planos, curvas e superfícies. Você poderia esclarecer o que quis dizer?
Mowzer 9/07
13

Um coletor (topológico) é um espaço que é:M

Rnn

"Locally", the "equivalence" can be expressed via n coordinate functions, cEu:MR, which together form a "structure-preserving" function, c:MRn, called a chart.

RNNn

Observe que, para tornar a "estrutura" precisa aqui, é preciso entender noções básicas de topologia ( def. ), O que permite fazer noções precisas do comportamento "local" e, portanto, "localmente" acima. Quando digo "equivalente", quero dizer estrutura topológica equivalente ( homeomórfica ), e quando digo "preservação de estrutura" quero dizer a mesma coisa (cria uma estrutura topológica equivalente).

Observe também que, para fazer o cálculo em variedades , é necessário uma condição adicional que não se segue das duas condições acima, que basicamente dizem algo como "os gráficos são bem comportados o suficiente para permitir o cálculo". Estes são os coletores usados ​​com mais frequência na prática. Diferentemente das variedades topológicas gerais , além do cálculo, elas também permitem triangulações , o que é muito importante em aplicativos como o seu envolvendo dados de nuvem de pontos .

Observe que nem todas as pessoas usam a mesma definição para uma variedade (topológica). Vários autores a definirão como satisfazendo apenas a condição (1) acima, não necessariamente também (2). No entanto, a definição que satisfaz tanto (1) como (2) é muito melhor comportada, portanto, mais útil para os praticantes. Pode-se esperar intuitivamente que (1) implica (2), mas na verdade não.

Rn

Chill2Macht
fonte
Obrigado por sua resposta: Você também pode explicar o que é uma topologia em termos não técnicos? O termo topologia e coletor é usado de forma intercambiável? A dimensão precisa ser um número inteiro? O que é que é um número real, então eu acho que a estrutura é conhecida como fractais, se toda a estrutura é composta de cada subparte é auto-repetitiva.
Ria George
1
n1N
@RiaGeorge Os axiomas para uma "topologia" podem ser encontrados na página da Wikipedia: en.wikipedia.org/wiki/General_topology#A_topology_on_a_set - observe também que o link que eu dei para a definição (equivalente) de "topologia" em termos de vizinhança apontou para algo relacionado, mas não é o mesmo, editei minha resposta para refletir isso: en.wikipedia.org/wiki/… Observe, porém, que a definição em termos de vizinhança é mais difícil de entender (imagino que eu possa entender) bem, mas eu não me incomodo muito, porque eu sou preguiçoso
Chill2Macht
de qualquer maneira, é minha opinião pessoal tendenciosa de que você não precisa conhecer a definição de topologia da vizinhança - apenas saiba que a definição mais simples fornece o mesmo poder da definição da vizinhança em termos de descrição rigorosa do comportamento local, uma vez que eles são equivalente). De qualquer forma, se você estiver interessado em fractais, talvez encontre essas páginas da Wikipedia interessantes - no entanto, não posso ajudá-lo mais, porque não estou profundamente familiarizado com a teoria e não conheço nem entendo a maioria das definições - só ouvi falar de algumas das
Chill2Macht 8/17/17
1
Até agora, esta é a única resposta que presta atenção à moderna idéia matemática de montar um objeto global a partir de dados locais. Infelizmente, não chega ao nível de simplicidade e clareza exigidas para uma conta "não técnica".
whuber
10

Nesse contexto, o termo coletor é preciso, mas é desnecessariamente alto -falutina. Tecnicamente, uma variedade é qualquer espaço (conjunto de pontos com uma topologia) que seja suficientemente suave e contínuo (de uma maneira que possa, com algum esforço, ser feita matematicamente bem definida).

Imagine o espaço de todos os valores possíveis de seus fatores originais. Após uma técnica de redução dimensional, nem todos os pontos nesse espaço são atingíveis. Em vez disso, apenas os pontos em algum subespaço incorporado dentro desse espaço serão atingíveis. Esse subespaço incorporado cumpre a definição matemática de uma variedade. Para uma técnica linear de redução dimensional como PCA, esse subespaço é apenas um subespaço linear (por exemplo, um hiperplano), que é uma variedade relativamente trivial. Mas para a técnica de redução dimensional não linear, esse subespaço poderia ser mais complicado (por exemplo, uma hiper superfície superficial curva). Para fins de análise de dados, entender que esses são subespaços é muito mais importante do que qualquer inferência que você extrairia ao saber que eles cumprem a definição de variedade.

David Wright
fonte
4
"Highfalutin" ... aprendeu uma nova palavra hoje!
Mehrdad
5
Matematicamente, um coletor é qualquer espaço topológico localmente contínuo. Gosto da ideia de tentar explicar as coisas em linguagem simples, mas essa caracterização realmente não funciona. Primeiro, a continuidade é sempre uma propriedade local, por isso não sei o que você quer dizer com localmente contínua. Além disso, sua definição falha ao descartar muitas coisas que não são múltiplas, como a linha numérica racional ou a união de duas linhas que se cruzam no plano euclidiano.
Ben Crowell
4
Eu concordo com Ben, tecnicamente é "localmente euclidiano". Não sei se há uma boa maneira de resumir isso ao inglês simples.
Matthew Drury
1
Eu também tenho que concordar fortemente com os dois comentários acima. De fato, a resposta que escrevi abaixo foi originalmente concebida para ser um comentário esclarecedor a essa resposta, que se tornou muito longo. Não há noção precisa de um espaço topológico "contínuo" (veja aqui: math.stackexchange.com/questions/1822769/… ). Definir múltiplas em termos de conceitos inexistentes é, na minha opinião, a longo prazo, mais provável que seja confuso do que esclarecedor. No mínimo, eu sugeriria substituir a palavra "matematicamente" na primeira frase por outra coisa.
precisa saber é o seguinte
Usarei esse comentário como uma oportunidade para fazer uma pequena pergunta ... Eu (acho) tive a idéia de variedades, mas por que é "localmente" necessário? Não é um espaço "localmente" contínuo ... contínuo como um todo?
Paul92