As respostas aqui afirmaram que as dimensões no t-SNE não têm sentido e que as distâncias entre os pontos não são uma medida de semelhança .
No entanto, podemos dizer algo sobre um ponto com base nos vizinhos mais próximos no espaço t-SNE? Esta resposta para por que os pontos exatamente iguais não são agrupados sugere que a razão de distâncias entre pontos é semelhante entre representações dimensionais mais baixas e mais altas.
Por exemplo, a imagem abaixo mostra t-SNE em um dos meus conjuntos de dados (15 classes).
Posso dizer que cro 479
(canto superior direito) é um erro externo? É fra 1353
(canto inferior esquerdo) é mais parecido com cir 375
o das outras imagens da fra
classe, etc? Ou poderiam ser apenas artefatos, por exemplo, fra 1353
ficaram presos do outro lado de alguns grupos e não conseguiram abrir caminho para a outra fra
classe?
Respostas:
Não, não é necessário que seja esse o caso, no entanto, esse é, de maneira complicada, o objetivo do T-SNE.
Antes de entrar na questão da resposta, vamos dar uma olhada em algumas definições básicas, matematicamente e intuitivamente.
Agora, finalmente, um exemplo de codificação puro que também demonstra esse conceito.
Embora este seja um exemplo muito ingênuo e não reflita a complexidade, ele funciona por experimento para alguns exemplos simples.
EDIT: Além disso, adicionando alguns pontos com relação à pergunta em si, por isso não é necessário que seja esse o caso, pode ser, no entanto, racionalizá-la através da matemática provaria que você não tem um resultado concreto (sem sim ou não definitivo) .
Espero que isso tenha esclarecido algumas de suas preocupações com o TSNE.
fonte