MultiWOZ-PT Um Conjunto de Diálogos Orientados a Tarefas em Português
Resumo
Apesar do amplo uso da língua portuguesa, corpos de diálogos em português, disponíveis publicamente e com anotações, são escassos. Isto torna ainda mais desafiante o desenvolvimento de sistemas de diálogo eficazes que comuniquem nesta língua. Assim, apresentamos o MultiWOZ-PT, um novo conjunto de diálogos orientados a tarefas, resultado da tradução manual de uma parte do conjunto MultiWOZ para a variedade europeia do português, e da adaptação da sua base de dados. Fornecemos diretrizes abrangentes sobre o processo de criação do MultiWOZ-PT e, para demonstrar a sua utilidade prática, realizamos experiências em dois cenários orientados a tarefas: Reconhecimento de Intenções e Monitorização do Estado do Diálogo, ambos úteis para sistemas de diálogo. Os resultados obtidos ilustram a utilidade do conjunto de dados e o seu potencial para treinar e avaliar modelos de compreensão de linguagem natural e gestão de diálogo para o português. Assim sendo, o MultiWOZ-PT constitui uma contribuição significativa para o processamento computacional dessa língua, incentivando mais pesquisas e desenvolvimento de trabalho nas áreas alvo.
Direitos de Autor (c) 2024 Patrícia Ferreira, Francisco Pais, Catarina Silva, Ana Alves, Hugo Gonçalo Oliveira
This work is licensed under a Creative Commons Attribution 4.0 International License.
Ao publicar na presente revista, os autores concordam com os seguintes termos:
- os direitos sobre a obra pertencem aos autores, que apenas concedem à Linguamática o direito de primeira publicação sob a licença Creative Commons, que permite que outros possam redistribuir a obra desde que acompanhada de referência ao autor e à Linguamática.
- os autores podem estabelecer outros contratos para a distribuição não exclusiva da obra, desde que mencionem que a sua primeira publicação foi efectuada na Linguamática.
- para aumentar as referências ao seu trabalho, os autores são encorajados a disponibilizar a obra, como "pré-publicação", antes de ou durante o processo de apreciação pela Linguamática, por exemplo em repositórios institucionais ou nas suas páginas pessoais na rede.