Anotação, análise e aprendizagem de Entidades Nomeadas em textos históricos portugueses (séc. XVIII)
Resumo
Este artigo apresenta um estudo baseado em textos portugueses do século XVIII, através da análise de entidades nomeadas, tendo em vista potenciá-las para análise histórica.
Para isso foi elaborado um corpus anotado, a partir de uma fonte (Memórias Paroquiais) transcrita, revista e normalizada. Posteriormente, realizou-se uma análise da distribuição das entidades nomeadas na fonte em apreço, para refletir sobre os significados da variação das categorias definidas tendo presente os requisitos dos historiadores. Em seguida, o corpus anotado foi usado para desenvolver modelos de Reconhecimento de Entidades Nomeadas (REN) que respeitem a referida complexidade da análise histórica. Foram treinados e avaliados diferentes soluções e modelos de linguagem para a tarefa de REN, onde os melhores modelos atingem F1 = 0.70. Dessa forma, este trabalho demonstra a utilidade do reconhecimento de entidades nomeadas nas análises de textos históricos e disponibiliza um modelo com capacidades de estender as anotações para um conjunto maior de textos com as mesmas características.
Direitos de Autor (c) 2025 Renata Vieira, Fernanda Olival, Helena Cameron, Fátima Farrica, Joaquim Santos, Daniel Reyes

This work is licensed under a Creative Commons Attribution 4.0 International License.
Ao publicar na presente revista, os autores concordam com os seguintes termos:
- os direitos sobre a obra pertencem aos autores, que apenas concedem à Linguamática o direito de primeira publicação sob a licença Creative Commons, que permite que outros possam redistribuir a obra desde que acompanhada de referência ao autor e à Linguamática.
- os autores podem estabelecer outros contratos para a distribuição não exclusiva da obra, desde que mencionem que a sua primeira publicação foi efectuada na Linguamática.
- para aumentar as referências ao seu trabalho, os autores são encorajados a disponibilizar a obra, como "pré-publicação", antes de ou durante o processo de apreciação pela Linguamática, por exemplo em repositórios institucionais ou nas suas páginas pessoais na rede.