Extracción no supervisada de patrones sintácticos para la identificación de relaciones de oposición léxica en español
Resumo
Los recursos léxicos son difíciles, costosos y requieren mucho tiempo para su producción y mantenimiento. En este trabajo, se propone una metodología para la extracción automática de relaciones léxicas de oposición, en particular de antónimos y cohipónimos, mediante patrones sintácticos yuxtapuestos, con el fin de contribuir a la construcción y expansión de recursos léxicos. A partir de un extenso corpus textual en español, reglas específicas y herramientas de análisis textual desarrolladas en Python, se implementó una metodología basada en tres módulos: (1) extracción de patrones de repetición, (2) filtración de cohipónimos mediante simetría, y (3) binarización de múltiples pares candidatos a antónimos. El sistema mostró un alto nivel de precisión en la clasificación de los cohipónimos y los antónimos, de acuerdo con una evaluación basada en anotaciones humanas. Los resultados demuestran que la metodología es capaz de identificar relaciones léxicas de oposición de manera eficiente, sin depender de recursos lingüísticos externos, lo cual puede contribuir al enriquecimiento y mantenimiento automatizado de recursos léxicos.
Direitos de Autor (c) 2025 Alejandro Pimentel-Alarcón, Gerardo Sierra, Alexander Gelbukh, Alec Sánchez-Montero

This work is licensed under a Creative Commons Attribution 4.0 International License.
Ao publicar na presente revista, os autores concordam com os seguintes termos:
- os direitos sobre a obra pertencem aos autores, que apenas concedem à Linguamática o direito de primeira publicação sob a licença Creative Commons, que permite que outros possam redistribuir a obra desde que acompanhada de referência ao autor e à Linguamática.
- os autores podem estabelecer outros contratos para a distribuição não exclusiva da obra, desde que mencionem que a sua primeira publicação foi efectuada na Linguamática.
- para aumentar as referências ao seu trabalho, os autores são encorajados a disponibilizar a obra, como "pré-publicação", antes de ou durante o processo de apreciação pela Linguamática, por exemplo em repositórios institucionais ou nas suas páginas pessoais na rede.








