Problema do vendedor ambulante com a rede neural

7

Fiquei curioso para saber se havia novos desenvolvimentos na solução do problema do vendedor ambulante usando algo como uma rede neural recorrente de Hopfield. Sinto que vi algo sobre pesquisas recentes obtendo um avanço nisso, mas não consigo encontrar os trabalhos acadêmicos em nenhum lugar. Alguém está ciente de novos desenvolvimentos novos nesta área?

Roubar
fonte
Que pesquisa você fez? Você pesquisou no Google Scholar?
DW
Li o artigo no Stack LSTM, que me disseram que poderia ajudar: arxiv.org/pdf/1506.02516.pdf , mas não estou vendo a conexão.
Rob
cair em Ciência da Computação bate-papo para possivelmente mais discussão / análise
vzn

Respostas:

4

Esta publicação do Medium lista os estudos mais recentes (não é uma lista completa, é claro) no domínio da otimização combinatória. Todos os três trabalhos usam o Deep Reinforcement Learning, que não precisa de nenhum conjunto de treinamento, mas aprende completamente com sua própria experiência.

Trabalho no primeiro artigo há algum tempo e o tempo de inferência está no nível de milissegundos. De acordo com seus experimentos, a taxa de aproximação (uma métrica que eles usam para comparar seu próprio método) em 1000-1200 casos de teste chega a 1,11.

tahsin kose
fonte
7

existem muitos trabalhos sobre o uso de redes neurais artificiais para resolver TSP, incluindo redes recorrentes e Hopfield, e elas "obtêm sucesso" em um sentido grosseiro, mas até agora não parece haver nenhuma evidência de que as técnicas sejam de alguma forma (fortemente?) superior a outras abordagens algorítmicas, então é algo mais como uma curiosidade de pesquisa no momento. o uso de RNAs para esse problema é realmente contra-intuitivo do ponto de vista de algoritmos combinatórios e os mecanismos pelos quais as entradas / saídas do problema são codificadas são novos e tendem a variar, e talvez ainda não sejam tão padronizados. os autores parecem talvez mais interessados ​​em demonstrar a "prova de conceito" e uma comparação com outros tipos de algoritmos parece mais rara (há alguns no último artigo). veja por exemplo

vzn
fonte
3
Acredito que será possível que as redes neurais resolvam dentro de um intervalo de confiança com alguma consistência. Assim a top 5% solution 85% of the time, fiquei curioso para saber como esse tipo de problema foi resolvido com uma rede neural, porque acabei de ler o artigo deepmind sobre as pilhas neurais. Parece que as Redes Neurais, especialmente as redes de aprendizado de Reforço Profundo, podem lidar com qualquer problema que um algoritmo genético teria no passado. Então essa foi a progressão em minha mente.
Rob
3

Eu comentei isso em outra resposta, mas acho que merece sua própria resposta. Alguns bolsistas do Google Brain apresentaram um método para resolver o TSP usando uma arquitetura remanescente do seq2seq no artigo de 2017 OTIMIZAÇÃO COMBINATORIAL NEURAL COM APRENDIZAGEM DE REFORÇO . Na introdução, eles chamam um artigo (1985) que usa redes Hopfield para resolver o TSP. Então essa ideia já existe há algum tempo.

Outra resposta mencionou o artigo "Pointer Networks" de 2015. Ele fez algo semelhante a este artigo, mas era um algoritmo supervisionado - precisava de dados rotulados. O artigo de 2017 não exige isso (usando a duração negativa do passeio como sinal de recompensa em um algoritmo de aprendizado por reforço).

A heurística "sempre aposta em redes neurais" não me decepcionou (mas, novamente, nunca passei por um inverno de IA).

Sam H.
fonte
11
Cuidado, porém: o artigo deixa claro que seus resultados estão "longe do estado da arte" na solução do TSP. É como se maravilhar com um cachorro dançando. A questão não é que ela dance particularmente bem; a parte surpreendente é que ele pode fazer qualquer coisa que se aproxime da dança.
DW
Obrigado por responder, estou feliz em revisitar essa curiosidade novamente!
Rob
Eu não sei DW, eu me lembro quando o aprendizado profundo era o cão da dança de reconhecimento de imagem ... e modelagem linguagem ... e xadrez ... e Go ...
Sam H.
0

Não vejo motivo para esperar que as redes neurais recorrentes da Hopfield ajudem no problema do vendedor ambulante.

As redes neurais são uma forma de aprendizado de máquina e são eficazes quando temos um conjunto de treinamento rotulado: várias instâncias, nas quais cada uma delas conhece a entrada (o vetor de recurso) e a etiqueta / classificação / saída correta. O aprendizado de máquina geralmente é útil para encontrar padrões quando não sabemos exatamente como definir qual é o resultado certo; "nós sabemos quando a vemos".

Por outro lado, o problema do vendedor ambulante é um problema combinatório: queremos saber o caminho mais curto através de um gráfico. Não há problema em definir ou especificar qual é a saída correta: é um problema matemático bem definido. Não há razão óbvia para pensar que o aprendizado de máquina seria útil para o problema do vendedor ambulante.

DW
fonte
Este artigo faz referência à tentativa de aplicar uma rede neural ao problema do vendedor ambulante: arxiv.org/pdf/1506.03134.pdf . Então, eu não sou completamente louco. Minha curiosidade sobre a questão era como ela poderia ser utilizada porque eu não conseguia imaginar uma maneira. Agradeço que dedique algum tempo e, se você ler o artigo, adoraria ouvir o que você pensa.
Rob
Além disso, este trabalho faz referência ao uso de uma rede de Hopfield para resolver o problema do caixeiro viajante cdn.intechopen.com/pdfs-wm/4612.pdf , bingo, portanto, não total de buzzword ;-)
Rob
@ Rob, que alguém escreveu algo e o postou no arXiv não significa que não está muito longe. A menos que isso tenha uma crítica séria, eu ficaria muito cauteloso.
vonbrand
11
Alguns doutores da UC Berkeley trabalhando para sons do Google como um time bastante respeitável para me .....
Rob
Aqui está a equipe do Google Brain, mostrando a otimização do TSP usando um modelo seq2seq openreview.net/pdf?id=rJY3vK9eg "Nós nos concentramos no problema do vendedor ambulante (TSP) e treinamos uma rede neural recorrente que, considerando um conjunto de coordenadas da cidade, prevê um distribuição através de diferentes permutações da cidade. Usando a duração negativa do passeio como sinal de recompensa, otimizamos os parâmetros da rede neural recorrente usando um método de gradiente de política ".
Sam H.