Anotação, análise e aprendizagem de Entidades Nomeadas em textos históricos portugueses (séc. XVIII)

Resumen

Este artigo apresenta um estudo baseado em textos portugueses do século XVIII, através da análise de entidades nomeadas, tendo em vista potenciá-las para análise histórica.

Para isso foi elaborado um corpus anotado, a partir de uma fonte (Memórias Paroquiais) transcrita, revista e normalizada. Posteriormente, realizou-se uma análise da distribuição das entidades nomeadas na fonte em apreço, para refletir sobre os significados da variação das categorias definidas tendo presente os requisitos dos historiadores. Em seguida, o corpus anotado foi usado para desenvolver modelos de Reconhecimento de Entidades Nomeadas (REN) que respeitem a referida complexidade da análise histórica. Foram treinados e avaliados diferentes soluções e modelos de linguagem para a tarefa de REN, onde os melhores modelos atingem F1 = 0.70. Dessa forma, este trabalho demonstra a utilidade do reconhecimento de entidades nomeadas nas análises de textos históricos e disponibiliza um modelo com capacidades de estender as anotações para um conjunto maior de textos com as mesmas características.

Publicado
2025-06-30
Cómo citar
Vieira, R., Olival, F., Cameron, H., Farrica, F., Santos, J., & Reyes, D. (2025). Anotação, análise e aprendizagem de Entidades Nomeadas em textos históricos portugueses (séc. XVIII). Linguamática, 17(1), 121-136. https://doi.org/10.21814/lm.17.1.445
Sección
PROPOR 2024 | Artículos Invitados