Qual é o significado dos eixos no t-SNE?

12

Atualmente, estou tentando entender a matemática do t-SNE . Infelizmente, ainda há uma pergunta que não consigo responder satisfatoriamente: qual é o significado real dos eixos em um gráfico t-SNE? Se eu fosse fazer uma apresentação sobre esse tópico ou incluí-lo em qualquer publicação: Como rotularia os eixos de maneira apropriada?

PS: Eu li essa pergunta do Reddit, mas as respostas dadas lá (como "depende da interpretação e do conhecimento do domínio") não me ajudam a entender isso.

Hagbard
fonte

Respostas:

20

Os eixos individuais no t-SNE não têm nenhum significado.

Algoritmos como MDS, SNE, t-SNE, etc. apenas se preocupam com distâncias entre pares. Eles tentam posicionar os pontos em um plano de modo que as distâncias entre pares minimizem um certo critério. Isso significa que, se você pegar um gráfico t-SNE e girá-lo, o arranjo resultante será igualmente bom no que diz respeito ao t-SNE. Portanto, a rotação geral que você obtém do algoritmo t-SNE é arbitrária.

Para rotular os eixos, recomendo escrever algo como "dimensão t-SNE 1" e "dimensão t-SNE 2".

(Às vezes, as pessoas escrevem "t-SNE 1" e "t-SNE 2" ou algo assim, o que é desleixado. Às vezes, vejo "t-SNE componente 1" e "t-SNE componente 2"; mas acho que a palavra "component" não funciona muito bem nesse contexto.)

ameba diz Restabelecer Monica
fonte
2
Um corolário dessa resposta é que a sugestão do Reddit está um pouco errada. Provavelmente, não há uma maneira razoável de interpretar os eixos em geral, mesmo se você tiver conhecimento de domínio para aplicar.
shadowtalker 30/05
3
Outro corolário dessa resposta é que os eixos devem ser exibidos na mesma escala, de modo que, se você multiplicar por uma matriz rotadora e inclinar a cabeça correspondentemente, o gráfico parecerá exatamente o mesmo. Infelizmente, isso está longe da prática padrão (resmungar!).
Eric_kernfeld