Qual é o bom uso do t-SNE, além da visualização de dados?

12

Em que situações devemos usar o t-SNE (além da visualização de dados)?

O T-SNE é usado para redução de dimensionalidade. A resposta a esta pergunta sugere que o t-SNE deve ser usado apenas para visualização e que não devemos usá-lo para agrupamento. Então, qual é o bom uso do t-SNE?

wolfe
fonte
6
O conselho padrão é NÃO usar tsne para cluster, porque os clusters são muito dependentes da perplexidade. É suposto ser usado apenas para "visualização". Mas isso não está muito claro para mim, já que se procura (e vê) agrupamentos imediatamente quando se olha para uma trama de tsne. Portanto, sua pergunta é boa: para que serve o tsne?
generic_user
2
Veja a resposta a esta pergunta que perguntei: stats.stackexchange.com/questions/263539/…
generic_user
como o @generic_user disse, eu quero saber os benefícios do t-sne, além da visualização.
Wolfe
Não sei por que isso foi fechado como duplicado. O OP está perguntando quais são os bons usos do t-sne além da visualização. O encadeamento vinculado é sobre clustering. Mas pode haver outros usos.
Ameba
Veja também: stats.stackexchange.com/questions/132639/…
Amelio Vazquez-Reina

Respostas:

4

A resposta a esta questão sugere que t-PND deve ser utilizada somente para visualização e que devemos não usá-lo para clustering. Então, qual é o bom uso do t-SNE?

Eu não concordo com esta conclusão. Não há razão para supor que o t-SNE seja pior universalmente que qualquer outro algoritmo de agrupamento. Todo algoritmo de agrupamento faz suposições sobre a estrutura dos dados e pode-se esperar que eles tenham um desempenho diferente, dependendo da distribuição subjacente e do uso final da dimensionalidade reduzida.

O t-SNE, como muitos algoritmos de aprendizado não supervisionado, geralmente fornece um meio para atingir um fim, por exemplo, obter informações precoces sobre se os dados são separáveis ​​ou não, testando se possui alguma estrutura identificável e inspecionando a natureza dessa estrutura. Não é necessário visualizar a saída do t-SNE para começar a responder a algumas dessas perguntas. Outras aplicações de incorporação de dimensões inferiores incluem a criação de recursos para classificação ou a eliminação da multicolinearidade para melhorar o desempenho dos métodos de previsão.

Amelio Vazquez-Reina
fonte