Estou tentando entender as diferenças entre os métodos de redução de dimensionalidade linear (por exemplo, PCA) e os não lineares (por exemplo, Isomap).
Não consigo entender direito o que a (não) linearidade implica nesse contexto. Eu li na Wikipedia que
Por comparação, se o PCA (um algoritmo de redução de dimensionalidade linear) for usado para reduzir esse mesmo conjunto de dados em duas dimensões, os valores resultantes não serão tão bem organizados. Isso demonstra que os vetores de alta dimensão (cada um representando uma letra 'A') que amostram essa variedade variam de maneira não linear.
O que
os vetores de alta dimensão (cada um representando uma letra 'A') que amostram essa variedade variam de maneira não linear.
significar? Ou mais amplamente, como eu entendo a (não) linearidade nesse contexto?
fonte
Uma imagem vale mais que mil palavras:
Aqui estamos procurando uma estrutura unidimensional em 2D. Os pontos estão ao longo de uma curva em forma de S. O PCA tenta descrever os dados com uma variedade linear unidimensional, que é simplesmente uma linha; é claro que uma linha se encaixa muito mal nesses dados. O Isomap está procurando um coletor unidimensional não linear (isto é, curvado!) E deve ser capaz de descobrir a curva em forma de S subjacente.
fonte