Extracção de relações semânticas entre palavras a partir de um dicionário: o PAPEL e a sua avaliação
Resumo
Neste artigo apresentamos o PAPEL, um recurso lexical para o português, constituído por relações entre palavras, extraídas de forma automática de um dicionário da língua geral através da escrita manual de gramáticas para esse efeito. Depois de contextualizarmos o tipo de recurso e as opções tomadas, fornecemos uma visão do processo da sua construção, apresentando as relações incluídas e a sua quantidade. Apresentamos também uma primeira avaliação, que tomou duas formas: para as relações de sinonímia, a comparação com o TeP 2.0, um recurso publicamente acessível e de cobertura vasta; para as outras relações, interrogando corpos em português. Esta segunda forma pode ser efectuada automaticamente, ou recorrendo a avaliadores. Nesta última vertente, integrado no projecto AC/DC, é oferecido mais um serviço de validação de relações à comunidade do processamento computacional da língua portuguesa, onde qualquer utilizador pode actuar como avaliador.
Publicado
2010-04-07
Como Citar
Oliveira, H. G., Santos, D., & Gomes, P. (2010). Extracção de relações semânticas entre palavras a partir de um dicionário: o PAPEL e a sua avaliação. Linguamática, 2(1), 77-93. Obtido de https://linguamatica.com/index.php/linguamatica/article/view/39
Edição
Secção
Artigos de Investigação
Ao publicar na presente revista, os autores concordam com os seguintes termos:
- os direitos sobre a obra pertencem aos autores, que apenas concedem à Linguamática o direito de primeira publicação sob a licença Creative Commons, que permite que outros possam redistribuir a obra desde que acompanhada de referência ao autor e à Linguamática.
- os autores podem estabelecer outros contratos para a distribuição não exclusiva da obra, desde que mencionem que a sua primeira publicação foi efectuada na Linguamática.
- para aumentar as referências ao seu trabalho, os autores são encorajados a disponibilizar a obra, como "pré-publicação", antes de ou durante o processo de apreciação pela Linguamática, por exemplo em repositórios institucionais ou nas suas páginas pessoais na rede.