As redes neurais de aprendizagem profunda serão executadas em computadores quânticos?

15

O Deep Learning (várias camadas de redes neurais artificiais usadas em tarefas de aprendizado de máquina supervisionadas e não supervisionadas) é uma ferramenta incrivelmente poderosa para muitas das tarefas mais difíceis de aprendizado de máquina: reconhecimento de imagem, vídeo, reconhecimento de fala, etc. dos mais poderosos algoritmos de aprendizado de máquina, e a Quantum Computing é geralmente considerada um divisor de águas para certas tarefas de computação muito difíceis, estou me perguntando se houve algum movimento na combinação dos dois.

  • Um algoritmo de aprendizado profundo poderia ser executado em um computador quântico?
  • Faz sentido tentar?
  • Existem outros algoritmos quânticos que tornariam irrelevante o aprendizado profundo?
Bob Swain
fonte
1
Não sou especialista, mas imagino que o algoritmo HHL seja útil nesse contexto.
DaftWullie 20/0918

Respostas:

8
  1. hora original

  2. Pelo fato, há ganhos computacionais claros em alguns processos: sim.

  3. Não que eu saiba. Mas alguém com mais experiência pode entrar aqui se quiser. A única coisa que vem à mente: geralmente podemos usar o Deep Learning e outras formas de Inteligência Artificial para estudar problemas de química e física porque a simulação é cara ou impraticável. Nesse domínio, os computadores quânticos provavelmente abaterão seus ancestrais clássicos, devido à sua capacidade de simular nativamente sistemas quânticos (como os da química nuclear) em tempo real ou mais rápido.

A última vez que falei com ele, Mario Szegedy estava interessado exatamente nisso, provavelmente há muitos outros pesquisadores trabalhando nisso agora.

ervilhas
fonte
6
Não estou convencido de que o algoritmo de Grover seja relevante aqui. O algoritmo de Grover encontra a única entrada que produz exatamente uma determinada saída. OTOH, as redes neurais são muito incomuns por natureza, e também não são exatamente exatas - na melhor das hipóteses, asympticamente precisas.
leftaroundabout
Ele pode ser tratado como um problema de pesquisa na base de dados, observando uma super posição de todos os estados em que os pesos podem estar. Deixe a função de pesquisa retornar 1, se a norma da derivada da rede neural em uma entrada padrão por meio dos pesos for menor que a tolerância desejada.
Frogeyedpeas 28/0318
1
Isso seria completamente inútil. Para qualquer problema não trivial, haverá muitas combinações de pesos nas quais o gradiente é zero; mesmo que o algoritmo de Grover lhe desse um desses, geralmente não seria um mínimo, muito menos um mínimo global.
leftaroundabout
Eu discordaria, considerando o seguinte protocolo: descida do gradiente de baunilha até algum limite e, em seguida, aplicaria a pesquisa de Grover em um espaço muito restrito de pesos para captar um mínimo rígido dentro de algum erro vinculado; essa parte final é onde a descida do gradiente geralmente converge muito lentamente para o ótimo local, e eu crescer curioso para saber se é aí que recorrer a Grover Pesquisa poderia ser interessantes
frogeyedpeas
1
Hum, isso pode funcionar; no entanto, nessa parte final, tenho certeza de que você também poderia fazer muito melhor do que a descida gradiente com meios clássicos. O gradiente biconjugado é o candidato óbvio.
leftaroundabout
13

Essa é uma pergunta muito aberta, mas sim, há uma quantidade considerável de trabalho que está sendo feito nessa frente.

Alguns esclarecimentos

Em primeiro lugar, deve-se notar que existem duas maneiras principais de mesclar o aprendizado de máquina (e o aprendizado profundo em particular) com a mecânica quântica / computação quântica:

Aplique técnicas clássicas de aprendizado de máquina para resolver problemas que surgem no contexto da mecânica quântica / informação quântica / computação quântica . Essa área está crescendo muito rápido para eu tentar uma lista decente de referências, então vou apenas apontar para alguns dos trabalhos mais recentes nessa direção: em 1803.04114 os autores usaram uma abordagem de aprendizado de máquina para encontrar circuitos para calcular a sobreposição entre dois estados (existem vários outros trabalhos nessa mesma direção) e, em 1803,05193, os autores estudaram como redes neurais profundas podem ser usadas para encontrar esquemas de correção de controle quântico.

Estudo de algoritmos quânticos para analisar big data , que geralmente equivale a procurar " generalizações quânticas " de algoritmos clássicos de aprendizado de máquina. Você pode dar uma olhada nesta outra resposta minha para obter algumas referências básicas sobre este tópico. Mais especificamente para o caso do aprendizado profundo , em 1412.3489 (apropriadamente chamado Quantum Deep Learning ), os autores propõem um método (efetivamente, um algoritmo quântico) para acelerar geralmente o treinamento de máquinas Boltzmann profundas e restritas . Outra referência relevante aqui é 1712.05304 , na qual os autores desenvolvem um algoritmo quântico de baixa profundidade para treinar máquinas Boltzmann quânticas. Ver 1708.09757, bem como as referências na resposta vinculada, para encontrar muitos outros trabalhos sobre isso. Observe que a aceleração reivindicada nesses trabalhos pode variar bastante, de acelerações exponenciais a polinomiais.

Às vezes, a aceleração vem do uso de algoritmos quânticos para resolver problemas algébricos lineares específicos (consulte a Tabela 1 em ( 1707.08561 ), às vezes vem do que basicamente equivale ao uso de (variações da) pesquisa de Grover e, às vezes, de outros citações de Dunjko e Briegel aqui :

As idéias para aprimoramentos quânticos para ML podem ser classificadas em dois grupos: a) abordagens que dependem da pesquisa e amplificação de amplitude de Grover para obter acelerações até quadráticas, e b) abordagens que codificam informações relevantes em amplitudes quânticas e com potencial para melhorias exponenciais. O segundo grupo de abordagens forma talvez a linha de pesquisa mais desenvolvida em ML quântico e coleta diversas ferramentas quânticas - principalmente a álgebra linear quântica, utilizada em propostas de ML quântico.

Resposta mais direta às três perguntas

Posto isto, permitam-me responder mais diretamente aos três pontos que você levantou:

  1. Um algoritmo de aprendizado profundo poderia ser executado em um computador quântico? Definitivamente, sim: se você pode executar algo em um computador clássico, pode fazê-lo em computadores quânticos. No entanto, a pergunta que se deve fazer é: um algoritmo quântico (profundo) de aprendizado de máquina pode ser mais eficiente do que os equivalentes clássicos ? A resposta a esta pergunta é mais complicada. Possivelmente sim , existem muitas propostas nessa direção, mas é muito cedo para dizer o que vai ou não funcionar.

  2. Faz sentido tentar? Sim!

  3. Existem outros algoritmos quânticos que tornariam irrelevante o aprendizado profundo? Isso depende muito do que você quer dizer com " irrelevante ". Quero dizer, pelo que se sabe no momento, pode muito bem haver algoritmos clássicos que tornarão o aprendizado profundo "irrelevante".
glS
fonte
3
No contexto desta resposta, gostaria de mencionar este artigo recente , que mostra como o algoritmo de otimização aproximada quântica pode ser usado para treinar redes neurais (máquinas Boltzmann restritas) empregando amostragem aproximada de Gibbs em computadores quânticos universais.
Mark Fingerhuth
1
@ MarkFingerhuth eu adicionei à resposta, obrigado pelo ponteiro (e bem-vindo ao site!)
glS 30/03
2

Aqui está um desenvolvimento mais recente do Xanadu, um circuito quântico fotônico que imita uma rede neural. Este é um exemplo de uma rede neural em execução em um computador quântico.

Este circuito fotônico contém interferômetros e portas de compressão que imitam as funções de pesagem de um NN, uma porta de deslocamento atuando como polarização e uma transformação não linear semelhante à função ReLU de um NN.

Eles também usaram esse circuito para treinar a rede para gerar estados quânticos e também implementar portas quânticas.

Aqui estão suas publicações e códigos usados ​​para treinar o circuito . Aqui está um artigo médio explicando seu circuito.

artha
fonte
2

Todas as respostas aqui parecem ignorar uma limitação prática fundamental:

O Deep Learning funciona melhor especificamente com big data. MNIST é 60000 imagens, ImageNet é 14 milhões de imagens.

Enquanto isso, os maiores computadores quânticos atualmente têm de 50 a 72 Qbits.

Mesmo nos cenários mais otimistas, os computadores quânticos que podem lidar com os volumes de dados que exigiriam algoritmos de Deep Learning, em vez dos métodos de modelagem mais tradicionais, não aparecerão tão cedo.

Portanto, aplicar QC ao Deep Learning pode ser uma boa curiosidade teórica, mas não algo que em breve será prático.

Alex Kinman
fonte