AlphaZero é um exemplo de uma AGI?

11

Do artigo de pesquisa do DeepMind em arxiv.org:

Neste artigo, aplicamos um algoritmo semelhante, mas totalmente genérico, que chamamos de AlphaZero , aos jogos de xadrez e shogi e Go, sem nenhum conhecimento adicional de domínio, exceto as regras do jogo, demonstrando que um aprendizado de reforço de propósito geral O algoritmo pode obter, tabula rasa, desempenho sobre-humano em muitos domínios desafiadores.

Isso significa que AlphaZero é um exemplo de AGI (Artificial General Intelligence)?

Thomas
fonte

Respostas:

11

Boa pergunta!

  • AlphaZero, embora seja um marco importante, definitivamente não é um AGI :)

O AlphaGo, embora forte no jogo de Go, é estreitamente forte ("IA forte-estreita"), definido como força em um único problema ou tipo de problema (como Go e outros jogos de informação perfeitos e sem chance).

  • A AGI, no mínimo, deve ser tão forte quanto o ser humano em todos os problemas trabalhados ou resolvidos pelo ser humano.

A AGI é frequentemente associada à superinteligência , definida como inteligência que supera os níveis humanos.

A AGI não implica necessariamente super-inteligência, no sentido em que consideramos um andróide que pode executar todas as atividades humanas com a mesma capacidade que os seres humanos que uma Inteligência Geral Artificial .

Porém, tecnicamente, o AlphaGo é uma superinteligência estreita, pois excede todo o desempenho humano em um único problema.

DukeZhou
fonte
Não há superinteligências estreitas. Chamamos isso de IA fraca :). Nenhum humano pode encontrar compilações semi-ótimas do Microsoft Word ou Excel em sua vida - enquanto máquinas modernas podem fazê-lo em algumas horas.
Quonux 01/04/19
@ Quonux Depende da definição, eu suspeito. A definição de superinteligência de Bostrom é aproximadamente análoga à Inteligência Geral Artificial, mas o próprio termo, etimologicamente falando, significa apenas "inteligência superior", literalmente "acima da inteligência". Sob essa definição básica, "IA forte e estreita" pode ser sinônimo de "superinteligência estreita", na medida em que a definição original de "forte" era AGI; portanto, após o AlphaGo, os pesquisadores começaram a usar o qualificador "restrito".
DukeZhou
A @Quonux parte do meu argumento aqui é que, com o advento do AlphaGo, o termo "fraco" para a IA que excede a capacidade humana em uma única tarefa parece ter sido suplantado pela "IA forte e estreita".
DukeZhou
2

Pressupostos que podem estar incorretos

Existem duas suposições identificáveis ​​no tom do artigo.

  • Todos os desafios mentais podem ser reduzidos a um jogo com regras fixas.
  • Máquinas melhores que os humanos são o que os humanos realmente querem ou precisam.

Existem outros dois identificáveis ​​na questão.

  • Inteligência geral existe em seres humanos 1
  • Se existe em humanos, é possível em computadores.

Todos os quatro podem ser verdadeiros, mas nenhum dos quatro é certo.

Produtividade do AlphaZero

Se nosso tabuleiro de xadrez estiver na prateleira do jogo em nosso armário, nossa grama for longa e nosso cortador de grama estiver quebrado, o AlphaZero, se conectado a um robô humanóide, não terá regras de jogo codificadas para a sequência de tarefas.

  • Ouvindo a solicitação de seu proprietário,
  • Aprendendo a dominar fantoches o robô,
  • Localizando e identificando todas as nossas ferramentas e peças de reposição,
  • Fixar o cortador de grama e
  • Deixe-nos saber que o cortador de grama está pronto para uso.

Portanto, não é de valor particular para o consumidor nesse cenário. Não é muito geral.

Mesmo que pudesse cortar a grama com um cortador de grama já funcionando, seria de valor, o que não requer a capacidade de ganhar nada, mas a capacidade de obedecer e exibir a inteligência subumana necessária para não atropelar o canteiro.

É notável que o pessoal inteligente do DeepMind optou por usar a tabula rasa latina em vez da folha em branco , mas não tão impressionante quanto a construção de um programa de aprendizado capaz de aprender a jogar três jogos bem, apenas com as regras codificadas e o jogo real como entrada.

Para considerar esses programas de jogos realmente úteis em um espaço de produto, não se pode confiar no interesse sustentado na compra de software que sempre bate no comprador. Para que os produtos de IA sejam viáveis, os recursos de aprendizado devem ser capazes do que é coloquialmente chamado de senso comum, o que exige um conhecimento de domínio muito mais amplo e flexível do que as regras fixas de um jogo. Podemos adivinhar que a maioria dos pesquisadores que alcançaram marcos na conquista do aprendizado de jogos está avançando nessa direção. Eles também sabem que sua produção de pesquisa deve eventualmente ser produtiva ou levar a uma oferta SaaS disponível.

O que seria impressionante para quem está fora do campo é se esses avanços puderem ser redirecionados, no espaço do data center, para gerar terapias genéticas corretivas para curar câncer ou herpes ou reverter diabetes ou Alzheimer. Poderíamos perdoar os pesquisadores por não nos fornecerem um download capaz de dominar fantoches um robô para limpar nosso banheiro. Não está claro no artigo que o AlphaZero demonstrou adequadamente que exibe "Desempenho sobre-humano em muitos domínios desafiadores".

O que eles fizeram ainda é impressionante e ao longo das linhas em que outros também fizeram progressos. Poucos de nós ousariam tentar inventar um jogo que esses programas genéricos de aprendizado de jogos não aprendessem rápido e nos derrotariam em algumas instâncias.

Avanços vistos em perspectiva

Certamente, ao executar aritmética, classificar correspondência e agora jogar, as invenções da humanidade ampliam as habilidades do humano nu, ausente de suas ferramentas. Esse progresso coloca os sistemas de computador firmemente dentro do domínio de uma ferramenta. Uma enxada traseira também é sobre-humana. Tente colocar um quilômetro de tubo sem um.

Por outro lado, a humanidade desempenha o papel de provedor de serviços de saúde para computadores. Se ficarem doentes ou falharem, somos obrigados a expulsar seus vírus e worms ou substituir as partes com falha. Caso contrário, nossas casas e empresas caem em desordem.

A tecnologia, como em todas as coisas, deve ser vista em perspectiva.

Seria prudente que os seres humanos se apaixonassem menos por jogos e se espancassem e se concentrassem mais no comportamento social colaborativo voltado para a solução de problemas sociais e econômicos com suas ferramentas recém-inventadas, e de maneira a não criar novos problemas ou convidar novas atrocidades.


Notas de rodapé

Que o que foi descrito como inteligência geral existe em humanos é discutível com base em evidências em contrário. Muitos citariam essas estratégias e tendências como evidência de limites para o ser humano inteligente.

  • Dissuasão nuclear como estratégia de paz
  • Uma completa falta de moderação no consumo de recursos finitos e críticos de energia natural
  • Aumento contínuo da densidade de padrões de dependência globalmente
  • Causando a sexta extinção em massa na Terra
Douglas Daseeco
fonte
Obrigado pela edição, é melhor assim (pelo menos para mim), com mais foco nas partes técnicas da resposta. Talvez haja uma pergunta diferente sobre o quão perfeitamente racional ou com alto desempenho uma AGI precisa ser. Da mesma forma, a quais padrões de comportamento individual ou de grupo queremos manter os humanos - embora isso não ocorra neste site, a menos que a pergunta seja especificamente sobre comparações com inteligências artificiais.
Neil Slater