Tradução Automática de expressões espaciais e não espaciais do inglês para o português
Um estudo envolvendo Raciocínio Espacial Qualitativo
Resumo
Os modelos neurais para a Tradução Automática representaram importantes avanços de desempenho por relação a modelos anteriores e, por isso, vêm sendo os mais empregados já há vários anos, mas ainda enfrentam dificuldades com expressões semanticamente mais complexas. Neste trabalho, investigamos o desempenho de dois dos sistemas de tradução automática mais utilizados da atualidade, Google Translator e DeepL, em expressões envolvendo representação e relação de objetos no espaço físico, sempre com a participação das mesmas preposições em inglês, divididas em situações com e sem interpretação espacial. Para a representação das expressões espacializadas, são aplicadas formalizações baseadas em modelos de Raciocínio Espacial Qualitativo, o que permite comparar a forma lógica de informações espaciais nos textos originais e em traduções automáticas do inglês para o português.
Os resultados mostram que esses dois grandes sistemas de tradução ainda cometem muitos erros com essas expressões de relativa complexidade. Entre eles, o Google Translator é o que mais erra globalmente (35,52% de erros). O DeepL, com melhor desempenho global (11,72% de erros), comete significativamente mais erros em expressões envolvendo espacialidade, o que sugere que a tradução dessas expressões aumenta a dificuldade da tradução para esse modelo. Além disso, ao realizar um estudo sobre o tipo específico das dificuldades em expressões espacializadas, vê-se que o problema de tradução automática mais frequente diz respeito à incorporação ou não de circunstâncias da ação, o que se realiza no predicado de formas distintas no inglês (em que o verbo tende a incorporar a maneira) e no português (em que a maneira é realizada em adjuntos do verbo). Os~resultados do presente trabalho fornecem elementos específicos para a avaliação e o aprimoramento dos modelos de tradução automática entre essas e outras línguas em que as mesmas diferenças de representação do predicado se verifiquem.
Direitos de Autor (c) 2025 Rafael Macário Fernandes, Rodrigo Souza, Marcos Lopes, Paulo Santos, Thomas Finbow

This work is licensed under a Creative Commons Attribution 4.0 International License.
Ao publicar na presente revista, os autores concordam com os seguintes termos:
- os direitos sobre a obra pertencem aos autores, que apenas concedem à Linguamática o direito de primeira publicação sob a licença Creative Commons, que permite que outros possam redistribuir a obra desde que acompanhada de referência ao autor e à Linguamática.
- os autores podem estabelecer outros contratos para a distribuição não exclusiva da obra, desde que mencionem que a sua primeira publicação foi efectuada na Linguamática.
- para aumentar as referências ao seu trabalho, os autores são encorajados a disponibilizar a obra, como "pré-publicação", antes de ou durante o processo de apreciação pela Linguamática, por exemplo em repositórios institucionais ou nas suas páginas pessoais na rede.