Uma rede léxico-semântica de grandes dimensões para o português, extraída a partir de dicionários electrónicos

  • Hugo Gonçalo Oliveira CISUC, Universidade de Coimbra
  • Leticia Antón Pérez CISUC, Universidade de Coimbra & Escola Superior de Enxeñería Informática, Universidade de Vigo
  • Hernani Costa CISUC, Universidade de Coimbra
  • Paulo Gomes CISUC, Universidade de Coimbra
Palavras-chave: dicionários, extracção de informação, relações semânticas, redes léxico-semânticas, ontologias lexicais, bases de conhecimento lexical

Resumo

Este artigo apresenta o CARTÃO, uma nova rede léxico-semântica para o português, composta por relações extraídas a partir de três dicionários electrónicos. Após analisarmos a estrutura das definições nos três, concluímos que as mesmas regras podiam ser utilizadas para extrair relações a partir de vários dicionários. Assim, aproveitamos este facto para utilizar o mesmo conjunto de gramáticas na construção desta rede. As relações que compõem o CARTÃO são apresentadas em termos de quantidade e de acordo com o dicionário de onde foram extraídas. Verifica-se que foi possível aumentar em mais de 70% o PAPEL, uma rede semelhante já existente, o que mostra os ganhos em utilizar mais do que um recurso na construção destas redes. A cobertura do CARTÃO e os resultados da validação automática de alguns tipos de relação são aqui também apresentados e discutidos.

Publicado
2012-01-01
Como Citar
Gonçalo Oliveira, H., Antón Pérez, L., Costa, H., & Gomes, P. (2012). Uma rede léxico-semântica de grandes dimensões para o português, extraída a partir de dicionários electrónicos. Linguamática, 3(2), 23-38. Obtido de https://linguamatica.com/index.php/linguamatica/article/view/116
Edição
Secção
Artigos de Investigação