Alguém ainda está usando a teoria conceitual da dependência?

11

Roger Schank fez um trabalho interessante sobre processamento de linguagem com a Conceptual Dependency (CD) na década de 1970. Ele então saiu um pouco do campo, estando na Educação atualmente. Havia algumas aplicações úteis na geração de linguagem natural (BABEL), geração de histórias (TAILSPIN) e outras áreas, geralmente envolvendo planejamento e episódios, em vez de frases individuais.

Alguém mais continuou a usar CD ou variantes? Não conheço nenhum outro projeto que o faça, além do PAULINE de Hovy, que usa o CD como representação para a história gerar.

natural-language-processing knowledge-representation Oliver Mason
fonte

1

Alguém ainda está usando a teoria conceitual da dependência?

Sim. Muitas pessoas. As dependências conceituais são centrais para a transmissão de idéias em linguagem natural.

Aqui estão apenas algumas publicações deste século, baseadas no trabalho de Schank ou viajando em paralelo com sua direção em áreas afins.

Eu conheci Roger Schank em Hartford, em 1992, durante uma série de palestras patrocinadas pelos laboratórios de IA do United Technologies Research Center e algumas outras empresas da Fortune 500 na região. Toda a sua palestra foi uma série de histórias em pesquisa de IA. Lembro-me de todas as histórias 26 anos depois.

As implementações de brinquedos da PNL que você vê hoje em campo empalidecem em comparação com os sistemas de raciocínio e memória baseados em histórias propostos pelo Dr. Schank como uma provável explicação das observações que podem ser feitas sobre as comunicações vocais humanas.

É fácil adivinhar o motivo pelo qual ele se mudou para a educação. Suas idéias sobre linguagem natural e inteligência artificial estavam cerca de um século antes e estavam sobre a cabeça da maioria das pessoas que estavam na palestra ao meu lado.

Se você e eu achamos convincentes suas propostas de raciocínio e memória baseadas em histórias, provavelmente estamos um século cedo demais e um pouco acima da cabeça da maioria no campo atual da PNL. A maioria das pessoas nos laboratórios dos anos 80 achou Schank irritante, e as pessoas que se encaixam confortavelmente na cultura tecnológica de hoje o consideram irrelevante.

Algumas das pessoas com quem interagi em um projeto da Universidade de Michigan em Ann Arbor não consideram seu trabalho irrelevante, e o trabalho delas está nas direções que ele indicou. Infelizmente, o cliente NDA me impede de comentar mais sobre esse projeto.

A razão pela qual não devemos e, finalmente, não abandonamos a idéia de que nos comunicamos nas histórias é porque ela está correta. Quando uma pessoa diz: "Isso me faz querer vomitar", ou "Eu também te amo", a análise direta dessas frases usando técnicas "modernas" não está diretamente relacionada a uma reconstrução correta da idéia na mente do indivíduo. alto falante. Ambas as frases fazem referência a um monte conceitual de interdependência que chamamos de história.

Se duas "garotas de festa" estão no banheiro feminino em um show de Borgore e uma diz: "Me passe um rolo", a interpretação da palavra "rolo" é conceitualmente dependente. Se o alto-falante estiver parado, isso significa uma coisa. Se na pia significa outra.

Sempre haverá algum segmento da comunidade de pesquisa que entende isso. Aqueles que não o fazem podem construir autômatos que economizam dinheiro que atendem às chamadas telefônicas da sua empresa, mas não fornecem um aviso sobre um padrão de relacionamento com o cliente que aponta para um problema de política.

Esses agentes de PNL de brinquedo, até desenvolverem os recursos que o Dr. Schank propôs, não reconhecerão nas conversas telefônicas com os clientes que um aprimoramento de produto ou serviço é uma oportunidade à espera de ser explorada e não contarão uma história que o convencerá que você se beneficiaria por ser o primeiro a aproveitar a oportunidade.

Douglas Daseeco
fonte

1

Embora esse modelo tenha desempenhado um papel importante na contribuição ao nosso conhecimento atual da PNL e da NLU, ele não é mais útil nos sistemas de produção e, atualmente, nenhum produto comercial de sucesso segue essa abordagem.

Na CDT, o objetivo era projetar um sistema de IA que pudesse extrair inferências lógicas das sentenças. Nesse sistema, o objetivo era tornar o significado independente das palavras usadas na entrada.

O CDT modelou frases usando tokens como: locais, horário, ações do mundo real e objetos do mundo real. No entanto, à medida que o poder computacional se tornou mais comum e mais barato, o interesse foi desviado para os modelos estatísticos que estavam agora superando os sistemas anteriores baseados em regras.

O problema com abordagens baseadas em regras, como a CDT, é que elas exigem o desenvolvimento manual de regras lingüísticas que podem ser caras e que geralmente não se generalizam para outras línguas.

Por outro lado, as abordagens estatísticas usam os recursos da linguagem humana (corpora textual multilíngue) com mais eficiência. Em vez de usar uma abordagem baseada em regras, os modelos estatísticos tomam decisões probabilísticas leves com base na anexação de pesos reais aos recursos que compõem os dados de entrada. (PNL da Wikipedia)

Esse uso eficiente dos recursos da linguagem humana leva a um modelo mais preciso e robusto, especialmente quando recebe informações ou informações desconhecidas que contêm erros. Modelos estatísticos também generalizam bem para outros idiomas.

Seth Simba
fonte

Obrigado pela sua resposta; Estou ciente dos modelos estatísticos e de suas propriedades, mas, para esta pergunta, eu estava interessado apenas no CDT!

Oliver Mason

O tópico foi uma alegria para pesquisar e responder. Apresentei modelos estatísticos no final para comparação, mas entendo totalmente o seu ponto.

Seth Simba

Alguém ainda está usando a teoria conceitual da dependência?

Respostas: