Anotação, análise e aprendizagem de Entidades Nomeadas em textos históricos portugueses (séc. XVIII)

Palavras-chave: reconhecimento de entidades nomeadas, Século XVIII

Resumo

Este artigo apresenta um estudo baseado em textos portugueses do século XVIII, através da análise de entidades nomeadas, tendo em vista potenciá-las para análise histórica.

Para isso foi elaborado um corpus anotado, a partir de uma fonte (Memórias Paroquiais) transcrita, revista e normalizada. Posteriormente, realizou-se uma análise da distribuição das entidades nomeadas na fonte em apreço, para refletir sobre os significados da variação das categorias definidas tendo presente os requisitos dos historiadores. Em seguida, o corpus anotado foi usado para desenvolver modelos de Reconhecimento de Entidades Nomeadas (REN) que respeitem a referida complexidade da análise histórica. Foram treinados e avaliados diferentes soluções e modelos de linguagem para a tarefa de REN, onde os melhores modelos atingem F1 = 0.70. Dessa forma, este trabalho demonstra a utilidade do reconhecimento de entidades nomeadas nas análises de textos históricos e disponibiliza um modelo com capacidades de estender as anotações para um conjunto maior de textos com as mesmas características.

Publicado
2025-06-30
Como Citar
Vieira, R., Olival, F., Cameron, H., Farrica, F., Santos, J., & Reyes, D. (2025). Anotação, análise e aprendizagem de Entidades Nomeadas em textos históricos portugueses (séc. XVIII). Linguamática, 17(1), 121-136. https://doi.org/10.21814/lm.17.1.445
Edição
Secção
PROPOR 2024 | Artigos Convidados