Qual é a qualidade real das traduções automáticas?

27

Até hoje eu - como leigo da IA ​​- estou confuso com as melhorias prometidas e alcançadas da tradução automática.

Minha impressão é: ainda há um caminho muito, muito distante. Ou existem outras explicações para por que as traduções automáticas (oferecidas e fornecidas, por exemplo, pelo Google), de artigos bastante simples da Wikipedia ainda leem e soam principalmente bobas, são dificilmente legíveis e apenas parcialmente úteis e úteis?

Pode depender de preferências pessoais (relativas à legibilidade, utilidade e utilidade), mas minhas expectativas pessoais são bastante decepcionadas.

O contrário: as traduções do Google são legíveis, úteis e úteis para a maioria dos usuários ?

Ou o Google tem motivos para manter suas conquistas (e não mostrar aos usuários o melhor que eles podem mostrar)?


Resultado preliminar: ainda estamos longe de podermos conversar com inteligências artificiais em pé de igualdade e entendimento - apenas no nível das cordas. Então, por que devemos ter medo? Porque eles sabem mais do que sabemos - mas não sabemos?

Hans-Peter Stricker
fonte
2
A tradução automática é um problema difícil, principalmente porque as técnicas modernas não tentam entender o texto a ser traduzido. Isso funciona mais ou menos em muitos casos, mas também pode falhar espetacularmente. Pessoalmente, acho que - tendo isso em mente - a maioria das traduções é útil e não tenho motivos para acreditar que as empresas de MT estão se atrasando. Talvez alguns aplicativos específicos de domínio sejam mais sensíveis comercialmente, mas não sejam MT gerais amplos.
Oliver Mason
@ OliveriverMason: "as técnicas modernas não tentam entender o texto a ser traduzido" - é essa a essência a ser contada? É assim que eu tenho que entender os resultados do MT? Triste o suficiente. (Alguma contradição da comunidade de IA seria muito bem-vinda!)
Hans-Peter Stricker
11
@ Hans-PeterStricker: Bem, tudo começou quando Fred Jelinek percebeu que despedir linguistas tornava o reconhecedor de fala mais preciso. Desde então, várias formas de aprendizado de máquina ultrapassaram a IA baseada em regras e agora mal temos a menor idéia de como a maioria dos sistemas de IA "realmente funciona" - exceto, talvez, no nível estocástico.
Kevin
2
@ Hans-PeterStricker Não é realmente útil pensar em um sistema de IA moderno como 'entender' alguma coisa. Pense nisso mais como um sistema que pega um conjunto de entradas e cria um conjunto de saídas. A entrada pode ser um texto em inglês e a saída, um texto em espanhol. O sistema 'aprendeu' isso com vários textos em inglês e seus equivalentes em espanhol. Isso significa que entende inglês ou espanhol? Essa é mais uma questão de filosofia. O que importa praticamente é que ele pode converter inglês em espanhol com algum grau de confiabilidade.
Josh Eller
Ele foi tocado levemente nas respostas, mas acho que vale a pena ressaltar que a resposta depende muito dos pares de idiomas dos quais você está falando. A qualidade do, digamos, inglês <-> espanhol, é muito mais alta que o inglês <-> japonês.
mbrig 6/06

Respostas:

21

Quem afirmou que a tradução automática é tão boa quanto um tradutor humano? Para mim, como tradutor profissional que vive da tradução há 35 anos, MT significa que minha produção diária de tradução de qualidade humana cresceu de fator 3 a 5, dependendo da complexidade do texto fonte.

Não posso concordar que a qualidade do MT diminua com o tamanho da entrada em idioma estrangeiro. Isso costumava ser verdade para os sistemas antigos com análises semânticas e gramaticais. Eu não acho que conheço todos os sistemas antigos (conheço Systran, uma ferramenta inútil da Siemens que foi vendida de uma empresa para outra como presente de Danaer, XL8, Personal Translator e Translate), mas até um sistema profissional em que investi 28.000 DM (!!!!) falhou miseravelmente.

Por exemplo, a frase:

Nesse dia quente de verão, eu tive que trabalhar e foi um pé no saco.

pode ser traduzido usando várias ferramentas de MT para o alemão.

Tradutor pessoal 20 :

Auf diesem heißen Sommertag musste ich arbeiten, und war in Schmerz im Esel.

Prompt :

Um outro sommertag michte ich arbeiten, está em guerra na Schmerz im Esel.

DeepL :

Um diesem heißen Sommertag musste ich arbeiten und es war eine Qual.

Google:

Um diesem heißen Sommertag musste ich arbeiten und es war em Schmerz im Arsch.

Hoje, o Google geralmente me apresenta traduções legíveis, quase corretas, e o DeepL é ainda melhor. Hoje de manhã, traduzi 3500 palavras em 3 horas e o resultado foi perfeito, embora o texto original estivesse cheio de erros (escritos em chinês).

Herbert
fonte
4
Para aqueles de nós que não são fluentes em alemão, não está claro quais dessas alternativas são boas e más. Eu sei que "Esel" significa "burro (animal)" e "Arsch" significa "burro (parte do corpo)". Não sei o que significa "Qual" ou se "ein Schmerz im Arsch" é aceitável.
Stig Hemmer
3
"Schmerz im Esel" é cômico (e errado). "Arsch" é uma palavra bastante coloquial, que você não usaria no alemão escrito. "Qual" é "dor", então é IMHO a melhor escolha, embora não seja muito precisa, pois a frase expressa aborrecimento ao invés de dor real.
Oliver Mason
11
@OliverMason Qual é uma boa tradução: dict.leo.org/englisch-deutsch/qual
yunzen
4
@OliverMason Eu sou um falante nativo de alemão e considero que ele se encaixa muito bem
yunzen
5
@OliverMason "dor na bunda" é uma expressão idiomática. Schmerz im Arsch não é: ninguém diz isso. "Qual" é uma tradução precisa do idioma inglês que, ao contrário do que você disse, raramente denota dor física real (e, da mesma forma, "Qual" pode ser dor literal e figurativa). Sem outro contexto, a tradução do DeepL parece perfeita.
Konrad Rudolph
7

As traduções do Google podem ser úteis, especialmente se você souber que as traduções não são perfeitas e se quiser ter uma idéia inicial do significado do texto (cujas traduções do Google às vezes podem ser bastante enganadoras ou incorretas). Eu não recomendaria que a tradução do Google (ou qualquer outro tradutor não humano) realizasse uma tradução séria, a menos que seja uma frase ou palavra comum, ela não envolva textos muito longos e idioma informal (ou gírias), as traduções envolvem o Idioma inglês ou você não tem acesso a um tradutor humano.

0 0100, Onde 100corresponde à tradução padrão-ouro humana) e avaliações lado a lado (um humano classifica as traduções) foram usadas. Se você usar apenas a métrica BLEU, as traduções da máquina serão muito ruins (mas a métrica BLEU também não é uma métrica de avaliação perfeita, porque geralmente há mais de uma tradução de uma determinada frase). No entanto, o GNMT reduz os erros de conversão em comparação com a tradução automática por frase (PBMT) .

No papel Tornando a IA significativa novamente , os autores também discutem a dificuldade da tarefa de tradução (que se acredita ser um problema completo da IA ). Eles também mencionam o transformador (outro modelo de tradução automática de última geração), que obtém resultados bastante ruins (avaliados usando a métrica BLEU).

Para concluir, a tradução automática é um problema difícil e os sistemas atuais de tradução automática definitivamente não têm um desempenho tão bom quanto um tradutor humano profissional.

nbro
fonte
A pontuação de 100 BLEU não significa tradução padrão-ouro humana, significa que ela corresponde exatamente à tradução de referência. Como geralmente existem várias maneiras de traduzir uma frase, mesmo a tradução humana geralmente não possui 100 BLEU, mas mais como 50-60.
justhalf 6/06
@justhalf Leia minha resposta novamente.
nbro
11
Obrigado pela resposta, e desculpe se o meu comentário anterior parecia rude. Meu argumento no comentário anterior foi que é impreciso dar a impressão de que a tradução humana receberá 100 pontos BLEU, o que parece ser sua resposta atual.
justhalf 6/06
@justhalf Acabei de dizer que 100corresponde a uma tradução "padrão ouro" humana. No entanto, também afirmo que a métrica BLUE não é perfeita, porque geralmente há mais de uma tradução de um determinado texto.
nbro 6/06
5

Você fez muitas perguntas, algumas das quais não podem ser respondidas definitivamente. Para dar uma idéia da qualidade (e de sua história) das traduções automáticas, eu gostaria de me referir a Christopher Manning, seu 'benchmark de uma frase', como apresentado em sua palestra . Ele contém um exemplo de chinês para inglês que é comparado com a saída do Google Translate. A tradução correta para o exemplo seria:

Em 1519, seiscentos espanhóis desembarcaram no México para conquistar o Império Asteca, com uma população de alguns milhões. Eles perderam dois terços de seus soldados no primeiro confronto.

O Google Tradutor retornou as seguintes traduções.

2009 1519 600 espanhóis desembarcaram no México, milhões de pessoas para conquistar o império asteca, os primeiros dois terços dos soldados contra sua perda.

2011 1519 600 espanhóis desembarcaram no México, milhões de pessoas para conquistar o império asteca, a perda inicial de soldados, dois terços de seus encontros.

2013 1519 600 espanhóis desembarcaram no México para conquistar o império asteca, centenas de milhões de pessoas, a perda inicial de confronto de soldados em dois terços.

2015 1519 600 espanhóis desembarcaram no México, milhões de pessoas para conquistar o império asteca, os primeiros dois terços da perda de soldados que enfrentam.

2017 Em 1519, 600 espanhóis desembarcaram no México, para conquistar os milhões de pessoas do império asteca, o primeiro confronto que mataram dois terços.

Se o Google mantém ou 'oculta' seus melhores resultados: duvido. Existem muitos pesquisadores excelentes trabalhando no campo do processamento de linguagem natural (PNL). Se o Google tivesse uma "maior conquista" para tradução, os pesquisadores descobririam mais cedo ou mais tarde. (Por que o Google ocultaria sua "maior conquista" de qualquer maneira? Eles parecem ver o benefício do código aberto, veja o Transformer [1] ou o BERT [2])

NB Para obter uma lista atualizada de algoritmos de ponta na PNL, consulte o cabeçalho do SQuAD2.0 .

[1] Vaswani, Ashish, et al. "Atenção é tudo que você precisa." Avanços nos sistemas de processamento de informações neurais. 2017.

[2] Devlin, Jacob, et al. "Bert: Pré-treinamento de transformadores bidirecionais profundos para o entendimento da linguagem." pré-impressão do arXiv arXiv: 1810.04805 (2018).

RikH
fonte
Muito obrigado pelo link para "pesquisadores bem remunerados". Ter as compensações em mente sempre ajuda a entender melhor as coisas (mesmo que eu não saiba o que você tinha em mente ao definir esse link).
Hans-Peter Stricker
O argumento também não era muito sólido. Removemos o link e tentamos melhorar o argumento. Eu tenho lido muitos artigos da PNL e estou bastante confiante em minhas descobertas, mas é difícil encontrar suporte para o argumento.
RikH
Informe-me sobre suas descobertas (se você não se importa). Meu endereço de e-mail pode ser encontrado na minha página de perfil.
Hans-Peter Stricker
11
2019 :In 1519, 600 Spaniards landed in Mexico to conquer the Aztec empire of millions of people, and they first met two-thirds of their soldiers.
Dan M.
4

Realmente depende do par de idiomas e do tópico do conteúdo. Traduzir para / de inglês para qualquer outro idioma geralmente é o melhor suportado. Traduzir para e de idiomas populares funciona melhor, por exemplo, traduzir do inglês para o romeno é uma tradução mais ruim que o inglês para o russo. Mas traduzir do inglês para o russo ou o romeno é melhor do que traduzir o russo para o romeno. E traduzir romeno para inglês é melhor do que traduzir inglês para romeno.

Mas se você está acostumado a trabalhar com tradutores e tem uma familiaridade passageira com os idiomas, os erros de tradução e o tópico, é fácil entender o que deveria estar lá. E, nesse ponto, às vezes é mais fácil ler algo traduzido para o seu idioma nativo para uma digitalização rápida do que ler em um segundo idioma.

Os idiomas menos populares (para tradução não necessariamente em número de falantes) estão muito mais próximos das traduções literais apenas um pouco melhor do que o que você faria pessoalmente usando um dicionário para dois idiomas que você não conhece.

Aaron Harun
fonte
2

Estou errado e as traduções do Google são legíveis, úteis e úteis para a maioria dos usuários?

Sim, eles são úteis e permitem que você traduza mais rapidamente.

Ou o Google tem motivos para manter suas maiores realizações (e não mostrar aos usuários o melhor que eles podem mostrar)?

Talvez eu não saiba. Se você procurar informações, o Google realmente faz um monte de coisas estúpidas horríveis, como aprender com o que os usuários dizem na internet, receber dados inadequados como conjuntos de dados de entrada confiáveis.

user8426627
fonte
2

Desculpas por não escrever em inglês. Encontre a tradução adaptada aqui:

Para dar às pessoas interessadas uma idéia da qualidade do MT (DeepL), veja este exemplo em um texto em que eu estava trabalhando nesta manhã (6.300 palavras, iniciadas às 9h, entrega hoje às 13h e ainda encontrar tempo para este post). Eu estava trabalhando nessa frase (201 palavras) quando postei meu comentário.

ou quaisquer processos que sejam executados ou ativados enquanto você não estiver conectado a este site, ou que de outra forma interfiram com o funcionamento adequado ou carreguem uma carga irracional na infraestrutura deste site; ou (e) usar software, dispositivos manuais ou automatizados, dispositivos ou outros processos para "rastrear", "raspar" ou "aranha" qualquer página deste site; ou (f) descompilar, fazer engenharia reversa ou tentar obter o código-fonte deste site. "

O DeepL retorna isso:

Em alguns países, a garantia e a veracidade desse tipo de informação são ABC: Dies Sie morre nicht tun werden: (a) betrügerische, mischüuchliche oder anderweitig illegale Actividades durchzuführen, anlass für der Beendigung Ihres düres odhühle döhle döhühle döhühle döhühle ou (b) Mitteilungen oder Aufforderungen, dazu bestimmt sind or sind, Passwörter, Konten oder private Informação de von anderen Nutzern dieser Website zu erhalten, zu posten oder zu übertragen oder posten oder zu posten oder zu übertragen; ou (c) a Sicherheit eines Computernetzwerks Verletzen, Passwörter oder Sicherheitsverschlüsselungscode knacken, ilegals Material (material einschließlich, al al bedrohlich oder obszön angesehen werden kann) die ausdrücklich verboten sind; ou (d) Mailliste, Listenserver ou outro formulário do Respondente Automático ou "Spam" no site ou Prozesse, o endereço de e-mail está incorreto ou não, este é o site que você está acessando. Belastung der Infrastructureuktur dieser Website stören; ou (e) manual ou automatizado Software, Gerador ou outro fornecedor local, um ou mais sites na Internet; zu "crawlen"; oder (f) dekompilieren, zurückzuentwickeln oder anderweitig zu versuchen, the Quellcode dieser Website website zu erhalten. os auscultadores foram encontrados em locais desconhecidos, onde há sites relacionados a este site, ou outros que pertencem a entidades ordinárias, por exemplo, Funktionieren oder eine unangemessene Belastung der Infrastructureuktur dieser Website; ou (e) manual ou automatizado Software, Gerador ou outro fornecedor local, um ou mais sites na Internet; zu "crawlen"; oder (f) dekompilieren, zurückzuentwickeln oder anderweitig zu versuchen, the Quellcode dieser Website website zu erhalten. os auscultadores foram encontrados em locais desconhecidos, onde há sites relacionados a este site, ou outros que pertencem a entidades ordinárias, por exemplo, Funktionieren oder eine unangemessene Belastung der Infrastructureuktur dieser Website; ou (e) manual ou automatizado Software, Gerador ou outro fornecedor local, um ou mais sites na Internet; zu "crawlen"; oder (f) dekompilieren, zurückzuentwickeln oder anderweitig zu versuchen, the Quellcode dieser Website website zu erhalten. zu kratzen, zu spinnen oder zu spinnen; oder (f) dekompilieren, zurückzuentwickeln oder anderweitig zu versuchen, the Quellcode dieser Website website zu erhalten. zu kratzen, zu spinnen oder zu spinnen; oder (f) dekompilieren, zurückzuentwickeln oder anderweitig zu versuchen, the Quellcode dieser Website website zu erhalten.

Levei cerca de 5 a 10 minutos para ajustar este parágrafo.

Como tradutor, sei que não posso confiar na tradução automática, mas aprendi as especificidades e capacidades dos diferentes sistemas ao longo do tempo e sei pelo que prestar atenção.

O MT me ajuda muito no meu trabalho.

Herbert
fonte
2
Observe que os textos legais produzem melhores traduções automáticas, pois há um monte de textos multilíngues nessa área.
Quora Feans
1

Isso não será tanto uma resposta como um comentário.

A qualidade depende de várias coisas, incluindo (como Aaron disse acima) 1) o par de idiomas e 2) o tópico, mas também 3) os gêneros e 4) o estilo do original e 5) a quantidade de texto paralelo que você possui para treinar o sistema MT.

Para preparar o cenário, praticamente todos os MTs hoje em dia são baseados em textos paralelos, que são textos em dois idiomas diferentes, com um presumivelmente sendo uma tradução do outro (ou ambos sendo uma tradução de algum terceiro idioma); e potencialmente usando dicionários (talvez auxiliados por processos morfológicos) como retrocesso quando os textos paralelos não contêm palavras específicas.

Além disso, como outros já disseram, um sistema de MT não entende os textos que está traduzindo; apenas vê sequências de caracteres e sequências de palavras compostas por caracteres e procura sequências e sequências semelhantes nos textos traduzidos anteriormente. (Ok, é um pouco mais complicado que isso, e houve tentativas de obter semântica em sistemas computacionais, mas, por enquanto, são principalmente strings.)

1) Os idiomas variam. Alguns idiomas têm muita morfologia, o que significa que eles fazem coisas com uma única palavra que outros idiomas fazem com várias palavras. Um exemplo simples seria o espanhol 'cantaremos' = inglês "vamos cantar". E um idioma pode fazer coisas que o outro idioma nem se importa, como a distinção informal / formal (tu / usted) em espanhol, à qual o inglês não tem equivalente. Ou um idioma pode fazer coisas com a morfologia que outro idioma faz com a ordem das palavras. Ou o script que o idioma usa pode nem marcar os limites das palavras (chinês e alguns outros). Quanto mais diferentes os dois idiomas, mais difícil será para o sistema MT traduzir entre eles. Os primeiros experimentos em estatística MT foram realizados entre francês e inglês,

2) Tópico: Se você tem textos paralelos na Bíblia (o que é verdade para quase qualquer par de idiomas escritos), e você treina seu sistema de MT a partir deles, não espere que ele se dê bem em textos de engenharia. (Bem, a Bíblia é uma quantidade relativamente pequena de texto para os padrões de treinamento dos sistemas de MT, mas finja :-).) O vocabulário da Bíblia é muito diferente do dos textos de engenharia, assim como a frequência de várias gramáticas. construções. (A gramática é essencialmente a mesma, mas em inglês, por exemplo, você tem muito mais voz passiva e substantivos mais compostos em textos científicos e de engenharia.)

3) Gêneros: Se o seu texto paralelo for todo declarativo (como os manuais do trator, digamos), tentar usar o sistema MT resultante na caixa de diálogo não obterá bons resultados.

4) Estilo: Pense Hilary vs. Donald; erudito x popular. O treinamento em um não obtém bons resultados no outro. Da mesma forma, treinar o sistema MT em romances para adultos e usá-lo em livros infantis.

5) Par de idiomas: o inglês possui muitos textos, e as chances de encontrar textos em algum outro idioma paralelo a um determinado texto em inglês são muito maiores do que as chances de encontrar textos paralelos em, por exemplo, russo e igbo. (Dito isto, pode haver exceções, como os idiomas da Índia.) Como uma generalização grosseira, quanto mais textos paralelos você tiver para treinar o sistema de MT, melhores resultados.

Em suma, a linguagem é complicada (e é por isso que eu a amo - sou linguista). Portanto, não é surpresa que os sistemas MT nem sempre funcionem bem.

Aliás, os tradutores humanos nem sempre se saem tão bem. Há uma ou duas décadas, eu estava recebendo traduções de documentos de tradutores humanos para o inglês, para serem usados ​​como materiais de treinamento para sistemas de MT. Algumas das traduções eram difíceis de entender e, em alguns casos, nas quais obtivemos traduções de dois (ou mais) tradutores humanos, era difícil acreditar que os tradutores estivessem lendo os mesmos documentos.

E finalmente, (quase) nunca há apenas uma tradução correta; existem várias maneiras de traduzir uma passagem, que podem ser mais ou menos boas, dependendo de quais recursos (correção gramatical, estilo, consistência de uso, ...) você deseja. Não há uma medida fácil de "precisão".

Mike Maxwell
fonte
1

Surpreendentemente, todas as outras respostas são muito vagas e tentam abordar isso a partir do tradutor humano POV. Vamos mudar para o engenheiro de ML.

Ao criar uma ferramenta de tradução, uma das primeiras perguntas que devemos considerar é "Como medimos se nossa ferramenta funciona?" .

O que é essencialmente o que o OP está pedindo.

Agora, essa não é uma tarefa fácil (algumas outras respostas explicam o porquê). Existe um artigo da Wikipedia que menciona diferentes maneiras de avaliar os resultados da tradução automática - existem escores humanos e automáticos (como BLEU , NIST , LEPOR ).

Com o surgimento das técnicas de redes neurais, essas pontuações melhoraram significativamente.

A tradução é um problema complexo. Há muitas coisas que podem dar certo (ou errado), e o sistema de tradução por computador geralmente ignora algumas das sutilezas, o que se destaca por um falante humano.

Penso que, se pensarmos no futuro, há poucas coisas nas quais podemos confiar:

  • Nossas técnicas estão ficando melhores, mais conhecidas e testadas. Isso vai melhorar a precisão a longo prazo.
  • Estamos desenvolvendo novas técnicas que podem levar em conta variáveis ​​previamente ignoradas ou apenas fazer um trabalho melhor.
  • Muitos dos modelos de tradução existentes atualmente são "reutilizados" para traduzir outros idiomas (por exemplo, tente traduzir "JEDEN" de polonês para chinês (tradicional) usando o Google Translator - você terminará com "ONE", que é uma evidência apontando o fato de o Google traduzir polonês para inglês e depois inglês para chinês). Obviamente, essa não é uma boa abordagem - você perderá algumas informações no processo - mas ainda assim funcionará; portanto, empresas como o Google as usam em idiomas em que não possuem dados ou força de trabalho suficientes. Com o tempo, modelos mais especializados aparecerão, o que melhorará a situação.
  • Além disso, como mencionado anteriormente, mais e mais dados apenas ajudarão a melhorar a tradução automática.

Resumindo, esse problema complexo, embora não resolvido, certamente está em um bom caminho e permite alguns resultados impressionantes para pares de idiomas bem pesquisados.

MatthewRock
fonte
"Surpreendentemente todas as outras respostas ...", nem todas as outras respostas. Eu diria "Algumas outras respostas" ou "A maioria das outras respostas".
nbro 6/06
0

"Ou o Google tem motivos para manter suas realizações (e não mostrar aos usuários o melhor que podem mostrar)"

Se eles fossem, então o que eles estavam escondendo seria incrível . O Google publica muitos documentos importantes sobre Processamento de linguagem natural, incluindo aqueles que obtêm resultados de última geração ou apresentam avanços conceituais significativos . Eles também lançaram conjuntos de dados e ferramentas muito úteis . O Google é uma das poucas empresas por aí que não está apenas usando a vanguarda da pesquisa atual, mas está contribuindo ativamente para a literatura.

A tradução automática é apenas um problema difícil. Um bom tradutor humano precisa ser fluente nos dois idiomas para fazer bem o trabalho. Cada idioma terá seus próprios idiomas e significados não literais ou dependentes do contexto. Trabalhar a partir de um dicionário de dois idiomas traria resultados terríveis (para humanos ou computadores); portanto, precisamos treinar nossos modelos em corpora existentes que existem em vários idiomas para aprender como as palavras são realmente usadas (frase compilada à mão: tabelas de tradução podem ser usadas como recursos ; elas simplesmente não podem ser a história toda). Para alguns pares de idiomas, corpora paralelo é abundante (por exemplo, para idiomas da UE, temos o processo completo do Parlamento Europeu).) Para outros pares, os dados de treinamento são muito mais escassos. E mesmo se tivermos dados de treinamento, existirão menos palavras e frases usadas que não aparecem com frequência suficiente para serem aprendidas.

Isso costumava ser um problema ainda maior, pois os sinônimos eram difíceis de explicar. Se nossos dados de treinamento tivessem frases para "O cachorro pegou a bola", mas não "O cachorro pegou a bola", teríamos uma probabilidade baixa para a segunda frase. De fato, seria necessária uma suavização significativa para evitar que a probabilidade fosse zero em muitos desses casos.

O surgimento de modelos de linguagem neural nos últimos 15 anos ajudou bastante a esse problema, permitindo que as palavras fossem mapeadas para um espaço semântico de valor real antes de aprender as conexões entre as palavras. Isso permite que sejam aprendidos modelos nos quais as palavras que estão próximas de significado também estão próximas no espaço semântico e, portanto, alternar uma palavra para seu sinônimo não afetará muito a probabilidade da frase que contém. word2vecé um modelo que ilustrou isso muito bem; mostrou que você poderia, por exemplo, pegar o vetor semântico para "rei", subtrair o vetor para "homem", adicionar o vetor para "mulher" e descobrir que a palavra mais próxima ao vetor resultante era "rainha". Uma vez que a pesquisa em modelos de linguagem neural começou a sério, começamos a ver quedas imediatas e massivas de perplexidade (ou seja, quão confusos os modelos eram pelo texto natural) e estamos vendo aumentos correspondentes no escore BLEU (ou seja, qualidade da tradução) agora que aqueles modelos de idiomas estão sendo integrados aos sistemas de tradução automática.

As traduções automáticas ainda não são tão boas quanto as traduções humanas de qualidade, e possivelmente não serão tão boas até que tenhamos uma IA totalmente sapiente. Mas bons tradutores humanos são caros, enquanto todos com acesso à Internet têm tradutores automáticos disponíveis. A questão não é se a tradução humana é melhor, mas o quão perto a máquina chega desse nível de qualidade. Essa lacuna está diminuindo e continua diminuindo.

Raio
fonte
Não gosto dessa abordagem - mas é uma questão de gosto e opinião. Ficar sem uma tradução "aprendida / sábia / compreensiva" só porque "os tradutores humanos são caros" me deixa triste. Então, o que é tradução?
Hans-Peter Stricker
@ Hans-PeterStricker Translation significa ser capaz de se comunicar com pessoas com as quais você não compartilha um idioma comum. Atualmente, a tradução automática é boa o suficiente para nos permitir fazer isso de certa forma, embora as traduções resultantes sejam frequentemente não gramaticais ou soem como um falante não nativo. (continuação ...)
Ray
Dependendo do que você quer dizer com "aprendido / sábio / compreensivo", já podemos estar fazendo isso. É isso que é o mapeamento para um vetor semântico; as palavras são incorporadas em um espaço vetorial que representa seu significado subjacente. O artigo de Sutskever que eu vinculei (como "conceitual") realmente faz a tradução mapeando a frase inteira em um vetor semântico e depois convertendo esse vetor em uma frase no idioma de destino. Então, um "entendimento" de um tipo está definitivamente acontecendo lá. (continuação ...)
Ray
Também existem modelos que aprendem a sintaxe subjacente (isto é, estrutura da sentença) e tem havido trabalho para integrar essa aos modelos neurais, embora, no momento, modelos que aprendam em que partes da sentença eles devam prestar atenção a qualquer momento. ser mais eficaz no tratamento desse tipo de coisa do que nos modelos sintáticos explícitos. (continuação ...)
Ray
Se você não acha que esse tipo de "entendimento" conta como Verdadeiro Entendimento, então o que seria diferente de uma IA que passa no Teste de Turing, ou seja, é totalmente sapiente? Observe que eu nunca disse que não podemos fazer uma IA totalmente sapiente (não sei dizer quanto tempo vai demorar; essa não é minha parte do campo. Mas tenho poucas dúvidas de que chegaremos lá eventualmente). Mas os modelos que estou descrevendo aqui são o que estamos usando agora e funcionam bastante bem para permitir que as pessoas se comuniquem. Pesquisa AI é toda sobre começar sucessivamente melhores versões de "bom o suficiente"
Ray