Transferência de estilo textual arbitrário em português

Palavras-chave: geração de língua natural, transferência de estilo arbitrário, paráfrases, sequência-para-sequência, grandes modelos de língua

Resumo

 Na Geração automática de língua natural, modelos de transferência de estilo textual arbitrário objetivam a reescrita de um texto usando qualquer novo conjunto de características estilísticas desejado. Em se tratando do idioma português, entretanto, observa-se que os recursos linguístico-computacionais necessários para o desenvolvimento de modelos deste tipo ainda são consideravelmente escassos em comparação à língua inglesa. Assim, como um primeiro passo em direção ao desenvolvimento de métodos avançados deste tipo, o presente trabalho investiga a questão da transferência de estilo textual arbitrário com o uso de paráfrases em português, combinadas ao uso de modelos neurais construídos a partir de arquiteturas do tipo sequência-para-sequência e por refinamento de grandes modelos de língua. Além dos modelos de reescrita textuais propriamente ditos, o estudo apresenta também recursos inéditos para a tarefa na forma de um córpus de paráfrases e de um modelo de \textit{embeddings} validado nas tarefas de similaridade e simplificação sentencial, com resultados comparáveis ao estado da arte.

Biografia Autor

Ivandré Paraboni, Escola de Artes, Ciências e Humanidades (EACH)Universidade de São Paulo (USP)
Professor-doutor junto à Escola de Artes, Ciências e Humanidades (EACH) da Universidade de São Paulo (USP) em São Paulo, Brasil.
Publicado
2023-12-30
Como Citar
Botton da Costa, P., & Paraboni, I. (2023). Transferência de estilo textual arbitrário em português. Linguamática, 15(2), 19-36. https://doi.org/10.21814/lm.15.2.410
Edição
Secção
Artigos de Investigação