Por que o vizinho mais próximo baseado em árvore KD é exponencial em K?

9

Eu já li em muitos artigos na pesquisa de vizinhos mais próximos de dimensões mais altas que as árvores KD são exponenciais em K, mas não consigo determinar o porquê.

O que estou procurando é uma sólida análise de complexidade de tempo de execução que explique esse aspecto do problema.

Akdom
fonte
O pensamento rápido é que essa ké efetivamente a dimensão do problema e, portanto, sofre com a "maldição da dimensionalidade".
Michael Klein

Respostas:

1

kNN tende a ser exponencial porque o espaço de pesquisa aumenta com . Imagine dividir o espaço em torno do seu ponto de pesquisa em quadrantes. Para k = 1, basta procurar dois 'quadrantes' (valores superiores e inferiores), para k = 2 são 4 quadrantes, para k = 3 são 8 quadrantes, ou seja, crescimento exponencial do espaço de pesquisa. É disso que a árvore kD sofre, porque precisa procurar sub-ramificações.2k2k

Outras árvores têm um desempenho muito melhor, por exemplo, o CoverTree . Também descobri que o PH-Tree funciona muito bem, parece demorar duas vezes mais que o CoverTree para conjuntos de dados entre k = 8 e k = 27 (eu não tinha conjuntos de dados com k mais alto).

TilmannZ
fonte
Observe que você pode usar o LaTeX aqui para digitar matemática de uma maneira mais legível. Veja aqui uma breve introdução.
Raphael