@article{Canosa_Gamallo_Varela_Taboada_Martínez Lema_Garcia_2019, title={Uma utilidade para o reconhecimento de topónimos em documentos medievais}, volume={11}, url={https://linguamatica.com/index.php/linguamatica/article/view/291}, DOI={10.21814/lm.11.1.291}, abstractNote={<p>Este artigo apresenta o método de construção duma ferramenta para a anotação de entidades geográficas mencionadas em textos medievais. A nova ferramenta foi desenvolvida a partir dos módulos de língua<br> contemporânea do LinguaKit, pacote multilingue de ferramentas de PLN. Uma coleção de corpora anotados manualmente serviu de recurso para elaborar uma lista de topónimos medievais (<em>gazetteers</em>) e<br> observar padrões para a melhora e implementação de novas regras de reconhecimento dos nomes de lugar. Depois da lista de entidades geográficas, os ativadores contextuais (<em>triggers</em>) foram o recurso determinante na melhora da abrangência. Para o produto final, fizeram-se também ajustes menores na procura de recolher os elementos mais comuns do léxico e os contextos gramaticais das entidades geográficas mencionadas. Ainda que muito trabalho fica por fazer na elaboração de listas para entidades não geográficas, na construção dum modelo de língua medieval e um lexicon específico, o novo módulo pode ser utilizado para anotar textos e mostra uma melhora significativa a respeito dos módulos previamente existentes.</p&gt;}, number={1}, journal={Linguamática}, author={Canosa, Xavier and Gamallo, Pablo and Varela, Xavier and Taboada, José Ángel and Martínez Lema, Paulo and Garcia, Marcos}, year={2019}, month={Jul.}, pages={3-15} }